detection_of_recombination_in_bacterial_genomes
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
detection_of_recombination_in_bacterial_genomes [2018/06/15 13:24] – [Snippy] hyjeong | detection_of_recombination_in_bacterial_genomes [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 28: | Line 28: | ||
/ | / | ||
| | ||
- | / | + | / |
+ | $ snippy --cpus 16 --outdir mysnps --ref E_coli.gbk --R1 read_1.fastq.gz --R2 read_2.fastq.gz | ||
+ | $ snippy-core --prefix core mysnps1 mysnps2 mysnps2 | ||
+ | snippy-core 결과물인 core.full.aln(whole genome SNP alignment including invariant sites)을 gubbins에 이용하면 된다. | ||
==== Harvest suite (parsnp) ==== | ==== Harvest suite (parsnp) ==== | ||
[[http:// | [[http:// | ||
Line 35: | Line 38: | ||
* Gingr - interactive visualization of alignments, trees and variants | * Gingr - interactive visualization of alignments, trees and variants | ||
* HarvestTools - Archiving and postprocessing | * HarvestTools - Archiving and postprocessing | ||
- | Parsnp가 기본적으로 생성하는 출력파일은 다음의 세 가지이다. Gingr에서 .ggr 파일을 열면 MFA 파일로 export할 수 있다. | + | Parsnp가 기본적으로 생성하는 출력파일은 다음의 세 가지이다. Gingr에서 .ggr 파일을 열면 MFA 파일로 export할 수 있다. XMFA(eXtended Multi FastA) 파일의 포맷은 [[http:// |
parsnp.ggr | parsnp.ggr | ||
- | * XMFA (eXtended Multi FastA) | ||
- | HarvestTools 유틸리티는 좀 더 다양한 포맷간의 전환을 도와준다. | ||
+ | HarvestTools 유틸리티는 좀 더 다양한 포맷간의 전환을 도와준다. Gingr 혹은 harvesttools에서 전환 가능한 파일 포맷에 대한 상세한 내용은 [[https:// | ||
+ | $ harvesttools -i parsnp.gingr -M multiFASTA.fna # (concatenated LCBs) | ||
+ | 이렇게 만들어진 multiFASTA 파일을 gubbins에 입력물로 제공해도 실행에는 문제가 없다. 그러나 LCB(locally collinear block)을 갭 없이 이어붙인 것이라서 원래의 좌표 정보가 더 이상 유효하지 않다. parsnp.xmfa를 정밀하게 parsing하면 reference coordinate에 맞추어서 각 LCB 사이에 알맞은 길이의 gap을 넣어서 연결한 서열을 만드는 것이 가능할지도 모른다. 하지만 그렇게 하느니 처음부터 whole genome alignment를 만드는 snippy를 쓰는 것이 바람직할 것이다. | ||
===== Gubbins ===== | ===== Gubbins ===== | ||
+ | * [논문] Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. Nucl Acid Res 2015 [[https:// | ||
+ | * [[https:// | ||
+ | BioConda 패키지를 이용하여 설치하였다(py35 environment). | ||
+ | $ run_gubbins.py dataset.aln | ||
+ | $ gubbins_drawer.py -o result.pdf dataset.final_tree.tre dataset.recombination_predictions.embl | ||
+ | $ gubbins_drawer.py -o results_SNPS.pdf dataset.final_tree.tre dataset.branch_base_reconstruction.embl | ||
===== Visualization using phandango ===== | ===== Visualization using phandango ===== | ||
detection_of_recombination_in_bacterial_genomes.1529036670.txt.gz · Last modified: (external edit)