User Tools

Site Tools


bioinfo:long_read_sequencing_결과물_다루기

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
bioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:31] – [UniCycler] hyjeongbioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:33] (current) – [Long read의 reference mapping] hyjeong
Line 37: Line 37:
 일반적인 hybrid assembly에서는 short read(일루미나)를 long read에 정렬하여 오류를 정정한 뒤 이를 이용하여 overlap-layout-consesus 기법의 조립을 수행하게 된다. 그러나 [[https://github.com/rrwick/Unicycler#method-hybrid-assembly|UniCycler의 hybrid assembly]]에서는 일루미나 데이터를 사용하여 먼저 SPAdes로 graph 형태의 assembly를 만든 뒤 여기에 long read를 더하여 repeat을 해소하고 complete genome sequence를 얻어내게 된다. 특히 circlator와 pilon을 마지막 단계에 실행하므로 별도의 post-process를 거치지 않아도 된다. 일반적인 hybrid assembly에서는 short read(일루미나)를 long read에 정렬하여 오류를 정정한 뒤 이를 이용하여 overlap-layout-consesus 기법의 조립을 수행하게 된다. 그러나 [[https://github.com/rrwick/Unicycler#method-hybrid-assembly|UniCycler의 hybrid assembly]]에서는 일루미나 데이터를 사용하여 먼저 SPAdes로 graph 형태의 assembly를 만든 뒤 여기에 long read를 더하여 repeat을 해소하고 complete genome sequence를 얻어내게 된다. 특히 circlator와 pilon을 마지막 단계에 실행하므로 별도의 post-process를 거치지 않아도 된다.
  
-사용하는 thread의 수는 -t 또는 %%--%%threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. [[사용하는 thread의 수는 -t 또는 --threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 실행 모드는 conservative, normal 및 bold의 세 가지가 있는데, --mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다. |실행 모드]]는 conservative, normal 및 bold의 세 가지가 있는데, %%--%%mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다. {{:bioinfo:conservative_normal_bold.png?400|Unicycler의 run mode}}+사용하는 thread의 수는 -t 또는 %%--%%threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 사용하는 thread의 수는 -t 또는 --threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 실행 모드는 conservative, normal 및 bold의 세 가지가 있는데, --mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다. |[[https://github.com/rrwick/Unicycler#conservative-normal-and-bold|실행 모드]]는 conservative, normal 및 bold의 세 가지가 있는데, %%--%%mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다.  
 + 
 +{{ :bioinfo:conservative_normal_bold.png?400 |Unicycler의 run mode}}
  
   $ unicycler -1 short_1.fastq -2 short_2.fastq -l long.fasta -o OUT_DIR -t 16   $ unicycler -1 short_1.fastq -2 short_2.fastq -l long.fasta -o OUT_DIR -t 16
Line 59: Line 61:
 ==== Assembly graph의 구조 확인 ==== ==== Assembly graph의 구조 확인 ====
  
 +LastGraph(Velvet), FASTA(SPAdes), 또는 GFA 등 de novo assembler가 만들어 내는 graph의 시각화에는 [[https://rrwick.github.io/Bandage/|Bandage]]를 활용한다. 이 프로그램은 Mac/Linux/Windows용을 같이 제공한다.
 +
 +  $ Bandage load assembly_graph.gfa
 +
 +인수 없이 Bandage라고만 입력하면 Bandage GUI가 작동하게 되며, File -> Load graph에서 그래프를 로드한 뒤 ‘Drawu graph’ 버튼을 클릭하면 화면에 시각화된 그래프가 표현된다.
 ===== Long read의 reference mapping ===== ===== Long read의 reference mapping =====
  
Line 69: Line 76:
   $ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads   $ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads
   # Convert SAM to BAM   # Convert SAM to BAM
-  $ samtools view –b –S –o aln.bam aln.sam # samtools version  1.9 (for -o’ option)+  $ samtools view –b –S –o aln.bam aln.sam # samtools version 1.9 (for '-ooption)
      
  
bioinfo/long_read_sequencing_결과물_다루기.1692232272.txt.gz · Last modified: by hyjeong