detection_of_recombination_in_bacterial_genomes
Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
detection_of_recombination_in_bacterial_genomes [2018/06/15 10:52] – created hyjeong | detection_of_recombination_in_bacterial_genomes [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 7: | Line 7: | ||
이 페이지에서는 Gubbins(Genealogies Unbiased By recomBinations in Nucleotide Sequences, [[https:// | 이 페이지에서는 Gubbins(Genealogies Unbiased By recomBinations in Nucleotide Sequences, [[https:// | ||
===== Genome alignment의 생성 ===== | ===== Genome alignment의 생성 ===== | ||
+ | ==== Snippy ==== | ||
+ | Snippy([[https:// | ||
+ | Snippy는 BioConda에 포함되어 있어서(최신 버전 4.0_dev) 설치는 매우 쉬웠다. 별도의 환경을 만들지 않고 Base에서 설치하면 된다. 설치를 마친 뒤 모든 프로그램이 다 깔린 상태인지를 snippy --check 명령으로 확인을 하니 vcfirstheader가 없다는 메시지가 나왔다. | ||
+ | 이 유틸리티는 vcflib([[https:// | ||
+ | |||
+ | 그런데 snippy의 첫 실행에서 다음과 같은 에러가 발생하였다. | ||
+ | |||
+ | java.lang.RuntimeException: | ||
+ | ... | ||
+ | | ||
+ | 이에 대해서는 이미 snippy issue 페이지에 154번째 문서로 보고된 상태이다([[https:// | ||
+ | |||
+ | conda remove snippy | ||
+ | conda install -c bioconda -c conda-forge snippy=3.2 | ||
+ | |||
+ | 이렇게 한 뒤 다시 테스트 러닝을 하였으나 제대로 결과가 나오지 않았다. snps.log 파일을 열어보니 이번에는 다음과 같은 내용이었다. | ||
+ | |||
+ | / | ||
+ | / | ||
+ | | ||
+ | / | ||
+ | |||
+ | $ snippy --cpus 16 --outdir mysnps --ref E_coli.gbk --R1 read_1.fastq.gz --R2 read_2.fastq.gz | ||
+ | $ snippy-core --prefix core mysnps1 mysnps2 mysnps2 | ||
+ | snippy-core 결과물인 core.full.aln(whole genome SNP alignment including invariant sites)을 gubbins에 이용하면 된다. | ||
+ | ==== Harvest suite (parsnp) ==== | ||
+ | [[http:// | ||
+ | * Parsnp - core-genome alignment and analysis | ||
+ | * Gingr - interactive visualization of alignments, trees and variants | ||
+ | * HarvestTools - Archiving and postprocessing | ||
+ | Parsnp가 기본적으로 생성하는 출력파일은 다음의 세 가지이다. Gingr에서 .ggr 파일을 열면 MFA 파일로 export할 수 있다. XMFA(eXtended Multi FastA) 파일의 포맷은 [[http:// | ||
+ | parsnp.ggr | ||
+ | |||
+ | HarvestTools 유틸리티는 좀 더 다양한 포맷간의 전환을 도와준다. Gingr 혹은 harvesttools에서 전환 가능한 파일 포맷에 대한 상세한 내용은 [[https:// | ||
+ | $ harvesttools -i parsnp.gingr -M multiFASTA.fna # (concatenated LCBs) | ||
+ | 이렇게 만들어진 multiFASTA 파일을 gubbins에 입력물로 제공해도 실행에는 문제가 없다. 그러나 LCB(locally collinear block)을 갭 없이 이어붙인 것이라서 원래의 좌표 정보가 더 이상 유효하지 않다. parsnp.xmfa를 정밀하게 parsing하면 reference coordinate에 맞추어서 각 LCB 사이에 알맞은 길이의 gap을 넣어서 연결한 서열을 만드는 것이 가능할지도 모른다. 하지만 그렇게 하느니 처음부터 whole genome alignment를 만드는 snippy를 쓰는 것이 바람직할 것이다. | ||
===== Gubbins ===== | ===== Gubbins ===== | ||
+ | * [논문] Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. Nucl Acid Res 2015 [[https:// | ||
+ | * [[https:// | ||
+ | BioConda 패키지를 이용하여 설치하였다(py35 environment). | ||
+ | $ run_gubbins.py dataset.aln | ||
+ | $ gubbins_drawer.py -o result.pdf dataset.final_tree.tre dataset.recombination_predictions.embl | ||
+ | $ gubbins_drawer.py -o results_SNPS.pdf dataset.final_tree.tre dataset.branch_base_reconstruction.embl | ||
===== Visualization using phandango ===== | ===== Visualization using phandango ===== | ||
detection_of_recombination_in_bacterial_genomes.1529027541.txt.gz · Last modified: (external edit)