User Tools

Site Tools


scaffolding

This is an old revision of the document!


Mate-pair library read(Ion Torrent)를 이용한 scaffolding

개요

Mate-pair library read는 일반적으로 Illumina platform에서 생성하게 되지만, Ion Torrent에서도 생산 가능하다. (rev, for) 방향의 paired file을 만들어내는 Illumina와는 달리 Ion Torrent에서는 라이브러리 구조상 하나의 read에 di-tag이 들어있게 되므로 sff_extract(+ssha2)로 이를 분리해야 하고, 방향에도 유의해야 한다. 본 실습에서는 Shigella boydii ATCC 9210에서 SOLiD 5500 mate-pair library kit로 만든 3 kb 라이브러리 유래 read(SRA accession: SRX1585054)를 사용하였다.

SSPACE는 최신 버전이 아니라 A5-miseq에 포함된 v1-1(2010년 11월 배포)을 사용한다.

$ export PATH=$PATH:/usr/local/Bio/bowtie2-2.2.6
$ export PATH=$PATH:/usr/local/Bio/a5_miseq_linux_20140604/bin
$ export PATH=$PATH:/usr/local/Bio/ssaha2_v2.5.5_x86_64
$ export PATH=$PATH:/usr/local/Bio/bin (for sff_extract, SolexaQA++, getinsertsize.py)

Di-tag의 분리 및 quality trimming

(주의) sed 실행에서는 read의 서열 ID 실제 형태에 맞는 패턴을 주어야 한다.

$ sff_extract -l linkers.fasta -s SB_iontor.fastq SB_0628.sff
$ SolexaQA++ dynamictrim SB_iontor.fastq –-torrent (default: P = 0.05)
$ sed -n '/^@BYI6V.*\/1$/{N;N;N;p;}' SB_iontor.fastq.trimmed > SB-trimmed_1.fastq
$ sed -n '/^@BYI6V.*\/1$/{N;N;N;p;}' SB_iontor.fastq.trimmed > SB-trimmed_1.fastq
[optional] SolexaQA++ lengthsort SB-trimmed_1.fastq SB-trimmed_2.fastq -l 40

linkers.fasta

>IA
CTGCTGTACCGTACATCCGCCTTGGCCGTACAGCAG
>IA_revcom
CTGCTGTACGGCCAAGGCGGATGTACGGTACAGCAG

(optional) Reference mapping을 통한 read 방향과 quality 확인

$ bowtie2-build SB_clc.fa SB
$ bowtie2 -x SB -2 SB-trimmed_1.fastq -1 SB-trimmed_2.fastq --ff -I 800 -X 5000 -S tmp.sam
$ samtools view -b -S -o tmp.bam tmp.sam
$ samtools view tmp.bam | getinsertsize.py -

SSPACE를 이용한 scaffolding

A5-miseq에 포함된 구 버전의 SSPAE(v1-1)는 paired end(→ ←, 0)와 mate-pair(← →, 1)만을 지원하므로, Ion Torrent에서 만들어진 mate-pair library read(RR, ← ←)을 사용하기 위해서는 read file 중 하나를 reverse complementary로 전환해야 함

$ seqtk seq -r SB-trimmed_1.fastq > 1rc.fastq
$ seqtk seq -r SB-trimmed_2.fastq > 2rc.fastq
$ path-to-SSPACE/SSPACE -l library.txt -s SB_clc.fa -k 5 -a 0.7 -x 1 -b SB_SSPACE_ext
$ cat SB_SSPACE_ext.summaryfile.txt
scaffolding.1455600008.txt.gz · Last modified: 2021/03/17 13:09 (external edit)