단일_contig_서열의_후처리
Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
단일_contig_서열의_후처리 [2016/02/18 09:13] – created hyjeong | 단일_contig_서열의_후처리 [2022/06/27 12:39] (current) – [서열의 전환과 일반적인 편집] hyjeong | ||
---|---|---|---|
Line 4: | Line 4: | ||
{{ : | {{ : | ||
==== 서열 말단의 overlap 검출 ==== | ==== 서열 말단의 overlap 검출 ==== | ||
+ | Contig 서열의 앞부분 20 kb 정도를 끊어내어 이를 query로 사용, 서열의 전체에 대해서 blastn으로 검색을 한다. 서열의 끝부분에 같은 방향으로 match가 발견되면 circular conformation을 이루는 것으로 추정할 수 있다. 그러나 단순한 repeat이 발생한 것이 아닌지 의심해 보아야 한다. 서열의 시작과 끝부분은 일반적으로 quality가 좋지 않으므로 100% identical한 alignment를 하지 못할 수도 있으니 유의해야 한다. | ||
==== 서열의 전환과 일반적인 편집 ==== | ==== 서열의 전환과 일반적인 편집 ==== | ||
- | [[http:// | + | [[http:// |
=== EMBOSS 패키지 내의 프로그램 사용법 확인 === | === EMBOSS 패키지 내의 프로그램 사용법 확인 === | ||
$ wossname < | $ wossname < | ||
Line 21: | Line 22: | ||
- Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다. | - Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다. | ||
+ | ==== Overlap 탐색의 실제 ==== | ||
+ | 다음은 NCBI blast+를 사용한 사례이다. [[http:// | ||
+ | $ seqret -sbegin 1 -send 20000 SB_HGAP_old.fa: | ||
+ | $ makeblastdb -in SB_HGAP_old.fa -dbtype nucl | ||
+ | $ blastn -db SB_HGAP_old.fa -query query.fa –out blast.out | ||
==== GC skew 그리기 ==== | ==== GC skew 그리기 ==== | ||
- | 직접적인 GC skew보다는 cumulative GC skew가 //oriC//를 파악하기에 더 좋다. 온라인 툴인 [[http:// | + | 직접적인 GC skew보다는 cumulative GC skew가 //oriC//를 파악하기에 더 좋다. 온라인 툴인 [[http:// |
+ | $ gc_skew.pl genome.fa > gc.txt | ||
+ | $ gnuplot | ||
+ | gnuplot> plot " | ||
+ | gnuplot> plot " | ||
{{ : | {{ : | ||
- |
단일_contig_서열의_후처리.1455754425.txt.gz · Last modified: (external edit)