User Tools

Site Tools


단일_contig_서열의_후처리

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
단일_contig_서열의_후처리 [2016/02/18 09:13] – created hyjeong단일_contig_서열의_후처리 [2022/06/27 12:39] (current) – [서열의 전환과 일반적인 편집] hyjeong
Line 4: Line 4:
 {{ :circle.png?480 |}} {{ :circle.png?480 |}}
 ==== 서열 말단의 overlap 검출 ==== ==== 서열 말단의 overlap 검출 ====
 +Contig 서열의 앞부분 20 kb 정도를 끊어내어 이를 query로 사용, 서열의 전체에 대해서 blastn으로 검색을 한다. 서열의 끝부분에 같은 방향으로 match가 발견되면 circular conformation을 이루는 것으로 추정할 수 있다. 그러나 단순한 repeat이 발생한 것이 아닌지 의심해 보아야 한다. 서열의 시작과 끝부분은 일반적으로 quality가 좋지 않으므로 100% identical한 alignment를 하지 못할 수도 있으니 유의해야 한다.
 ==== 서열의 전환과 일반적인 편집 ==== ==== 서열의 전환과 일반적인 편집 ====
-[[http://emboss.sourceforge.net/|EMBOSS package]]에는 서열의 조작을 비롯한 다양한 생명정보 분석용 프로그램이 포함되어 있다. 설치하기가 불편하면 EMBOSS server([[http://www.bioinformatics.nl/emboss-explorer/|사례]]를 이용해도 된다. +[[http://emboss.sourceforge.net/|EMBOSS package]]에는 서열의 조작을 비롯한 다양한 생명정보 분석용 프로그램이 포함되어 있다. 설치하기가 불편하면 EMBOSS server([[http://www.bioinformatics.nl/emboss-explorer/|사례]])를 이용해도 된다. 
 === EMBOSS 패키지 내의 프로그램 사용법 확인 === === EMBOSS 패키지 내의 프로그램 사용법 확인 ===
   $ wossname <keyword> (keyword와 관련있는 EMBOSS 프로그램 출력)   $ wossname <keyword> (keyword와 관련있는 EMBOSS 프로그램 출력)
Line 21: Line 22:
   - Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다.   - Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다.
  
 +==== Overlap 탐색의 실제 ====
 +다음은 NCBI blast+를 사용한 사례이다. [[http://cube.univie.ac.at/gepard|Gepard(GEnome PAir Rapid Dotter)]]도 도움이 될 것이다.
 +  $ seqret -sbegin 1 -send 20000 SB_HGAP_old.fa:SB_hgap1_14 query.fa
 +  $ makeblastdb -in SB_HGAP_old.fa -dbtype nucl
 +  $ blastn -db SB_HGAP_old.fa -query query.fa –out blast.out
  
 ==== GC skew 그리기 ==== ==== GC skew 그리기 ====
-직접적인 GC skew보다는 cumulative GC skew가 //oriC//를 파악하기에 더 좋다. 온라인 툴인 [[http://genskew.csb.univie.ac.at|GenSkew]]를 사용하거나 간단한 Perl script를 활용하면 된다.+직접적인 GC skew보다는 cumulative GC skew가 //oriC//를 파악하기에 더 좋다. 온라인 툴인 [[http://genskew.csb.univie.ac.at|GenSkew]]를 사용하거나 간단한 Perl script [[gc_skew.pl]](BioPerl 필요)를 활용하면 된다. 
 +  $ gc_skew.pl genome.fa > gc.txt 
 +  $ gnuplot 
 +  gnuplot> plot "gc.txt" using 1:2 with lines (GC skew) 
 +  gnuplot> plot "gc.txt" using 1:3 with lines (cumulative GC skew)
 {{ :skew.png?480 |}} {{ :skew.png?480 |}}
- 
단일_contig_서열의_후처리.1455754425.txt.gz · Last modified: (external edit)