User Tools

Site Tools


de_novo_assembly

This is an old revision of the document!


De novo assembly

1. Velvet

(optional) Interleaved file의 준비

$ /usr/local/Bio/velvet_1.2.10/contrib/shuffleSequences_fasta/shuffleSequences_fastq.pl BL21-20x_1.fastq  BL21-20x_2.fastq BL21-paired.fastq  
  • 최근에는 -separate 옵션이 추가되어서 2개의 paired file을 그대로 공급해도 됨
  • velvetg 또는 velveth를 실행하여 MAXKMERLENGTH를 확인

[1] Velvet의 직접 실행(velveth -> velvetg)

$ /usr/local/Bio/velvet_1.2.10/velveth velvet_out 53 -shortPaired -fastq BL21-paired.fastq 또는
$ /usr/local/Bio/velvet_1.2.10/velveth velvet_out 53 -shortPaired -fastq -separate BL21-20x_1.fastq BL21-20x_2.fastq
$ /usr/local/Bio/velvet_1.2.10/velvetg velvet_out -cov_cutoff auto -exp_cov auto
$ /usr/local/Bio/bin/n50.pl contigs.fa (결과의 확인)

[2] Velvetoptimiser를 이용한 최적화 실행

  • BioPerl이 설치되어 있어야 함
  • velveth, velvetg가 PATH 환경변수에 설정되어 있어야 함
  • -optFuncKmer 기본 설정은 n50(Lcon은 large contig의 수에 최적화)
  • hash length(Kmer)의 범위를 -s <start value> -e <end value>로 설정하면 2씩 증가시켜 가면서 실행함. step value(기본 2)는 –x로 설정(원래 옵션을 –s 21 –e 65 –x 2와 같이 쓰도록 하고 있으나 -s -e -x 2로 사용해도 무방함)
$ export PATH=$PATH:/usr/local/Bio/velvet_1.2.10
$ /usr/local/Bio/velvet_1.2.10/contrib/VelvetOptimiser-2.2.4/VelvetOptimiser.pl -s 35 -e 61 -optFuncKmer=Lcon -f '-shortPaired -fastq BL21-paired.fastq'
$ /usr/local/Bio/bin/n50.pl auto_data_39/contigs.fa (결과의 확인)

2. A5-miseq (ngopt)

de_novo_assembly.1455582400.txt.gz · Last modified: 2021/03/17 13:09 (external edit)