User Tools

Site Tools


bioinfo:long_read_sequencing_결과물_다루기

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
bioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:26] – [Canu] hyjeongbioinfo:long_read_sequencing_결과물_다루기 [2023/08/17 09:33] (current) – [Long read의 reference mapping] hyjeong
Line 33: Line 33:
 ==== UniCycler ==== ==== UniCycler ====
  
 +[[https://github.com/rrwick/Unicycler|UniCycler]]는 세균의 유전체 조립을 위하여 만들어진 프로그램이다. 일루미나 데이터만 있다면 SPAdes-optimiser로 작동하는 반면, long-read data만 있는 상황에서는 minisam+Racon 파이프라인으로 작동한다. 그러나 일루미나 데이터와와 long read를 함께 사용하는 hybrid assembler로서 작동할 때 가장 정확한 결과를 생성한다.
 +
 +일반적인 hybrid assembly에서는 short read(일루미나)를 long read에 정렬하여 오류를 정정한 뒤 이를 이용하여 overlap-layout-consesus 기법의 조립을 수행하게 된다. 그러나 [[https://github.com/rrwick/Unicycler#method-hybrid-assembly|UniCycler의 hybrid assembly]]에서는 일루미나 데이터를 사용하여 먼저 SPAdes로 graph 형태의 assembly를 만든 뒤 여기에 long read를 더하여 repeat을 해소하고 complete genome sequence를 얻어내게 된다. 특히 circlator와 pilon을 마지막 단계에 실행하므로 별도의 post-process를 거치지 않아도 된다.
 +
 +사용하는 thread의 수는 -t 또는 %%--%%threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 사용하는 thread의 수는 -t 또는 --threads 옵션으로 지정하지 않으면 8을 기본으로 택한다. 실행 모드는 conservative, normal 및 bold의 세 가지가 있는데, --mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다. |[[https://github.com/rrwick/Unicycler#conservative-normal-and-bold|실행 모드]]는 conservative, normal 및 bold의 세 가지가 있는데, %%--%%mode 옵션을 통하여 지정한다. 특별히 설정하지 않으면 normal mode로 작동한다. 
 +
 +{{ :bioinfo:conservative_normal_bold.png?400 |Unicycler의 run mode}}
 +
 +  $ unicycler -1 short_1.fastq -2 short_2.fastq -l long.fasta -o OUT_DIR -t 16
 +
 +신뢰할 수 있는 [[http://gfa-spec.github.io/GFA-spec/|GFA 포맷]]의 long read assembly가 있다면 %%--%%existing_long_read_assembly 옵션으로 지정하면 된다. 
 ==== Flye ==== ==== Flye ====
  
Line 50: Line 61:
 ==== Assembly graph의 구조 확인 ==== ==== Assembly graph의 구조 확인 ====
  
 +LastGraph(Velvet), FASTA(SPAdes), 또는 GFA 등 de novo assembler가 만들어 내는 graph의 시각화에는 [[https://rrwick.github.io/Bandage/|Bandage]]를 활용한다. 이 프로그램은 Mac/Linux/Windows용을 같이 제공한다.
 +
 +  $ Bandage load assembly_graph.gfa
 +
 +인수 없이 Bandage라고만 입력하면 Bandage GUI가 작동하게 되며, File -> Load graph에서 그래프를 로드한 뒤 ‘Drawu graph’ 버튼을 클릭하면 화면에 시각화된 그래프가 표현된다.
 ===== Long read의 reference mapping ===== ===== Long read의 reference mapping =====
  
Line 60: Line 76:
   $ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads   $ minimap2 -ax map-ont ref.fa ont-reads.fq > aln.sam # for Oxford Nanopore reads
   # Convert SAM to BAM   # Convert SAM to BAM
-  $ samtools view –b –S –o aln.bam aln.sam # samtools version  1.9 (for -o’ option)+  $ samtools view –b –S –o aln.bam aln.sam # samtools version 1.9 (for '-ooption)
      
  
bioinfo/long_read_sequencing_결과물_다루기.1692231960.txt.gz · Last modified: by hyjeong