bioinfo:long_read_sequencing_결과물_다루기
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:23] – [Long read의 reference mapping] hyjeong | bioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:33] (current) – [Long read의 reference mapping] hyjeong | ||
---|---|---|---|
Line 18: | Line 18: | ||
==== Canu ==== | ==== Canu ==== | ||
+ | 진핵생물의 유전체의 경우 20x 정도의 시퀀싱 데이터만 있어도 canu를 사용하면 현존하는 hybrid method를 능가하는 결과를 얻을 수 있다. 그러나 최소 30~60x 정도의 데이터로 조립을 시작하는 것이 바람직하다. 다음은 25x의 대장균 PacBio 시퀀싱 데이터를 다운로드하여 조립하는 명령어이다. Nanopore data는 -nanopore 옵션을 사용한다(샘플 데이터 다운로드 [[https:// | ||
+ | |||
+ | $ curl -L -o pacbio.fastq http:// | ||
+ | $ canu -p ecoli -d ecoli-pacbio | ||
+ | | ||
+ | 조립 결과물 중 < | ||
+ | |||
+ | > | ||
+ | > | ||
+ | |||
+ | Contig와 unitig에 대한 보다 정확한 의미는 [[https:// | ||
+ | |||
+ | 위에서 소개한 명령어는 raw long read의 correction, trimming, 그리고 조립을 한 번의 명령어로 진행하는 사례를 보인 것이지만, | ||
==== UniCycler ==== | ==== UniCycler ==== | ||
+ | [[https:// | ||
+ | |||
+ | 일반적인 hybrid assembly에서는 short read(일루미나)를 long read에 정렬하여 오류를 정정한 뒤 이를 이용하여 overlap-layout-consesus 기법의 조립을 수행하게 된다. 그러나 [[https:// | ||
+ | |||
+ | 사용하는 thread의 수는 -t 또는 %%--%%threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 사용하는 thread의 수는 -t 또는 --threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 실행 모드는 conservative, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | $ unicycler -1 short_1.fastq -2 short_2.fastq -l long.fasta -o OUT_DIR -t 16 | ||
+ | |||
+ | 신뢰할 수 있는 [[http:// | ||
==== Flye ==== | ==== Flye ==== | ||
Line 37: | Line 61: | ||
==== Assembly graph의 구조 확인 ==== | ==== Assembly graph의 구조 확인 ==== | ||
+ | LastGraph(Velvet), | ||
+ | |||
+ | $ Bandage load assembly_graph.gfa | ||
+ | |||
+ | 인수 없이 Bandage라고만 입력하면 Bandage GUI가 작동하게 되며, File -> Load graph에서 그래프를 로드한 뒤 ‘Drawu graph’ 버튼을 클릭하면 화면에 시각화된 그래프가 표현된다. | ||
===== Long read의 reference mapping ===== | ===== Long read의 reference mapping ===== | ||
Line 47: | Line 76: | ||
$ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads | $ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads | ||
# Convert SAM to BAM | # Convert SAM to BAM | ||
- | $ samtools view –b –S –o aln.bam aln.sam # samtools version | + | $ samtools view –b –S –o aln.bam aln.sam # samtools version |
| | ||
bioinfo/long_read_sequencing_결과물_다루기.1692231807.txt.gz · Last modified: by hyjeong