User Tools

Site Tools


detection_of_recombination_in_bacterial_genomes

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
detection_of_recombination_in_bacterial_genomes [2018/06/15 14:07] – [Harvest suite (parsnp)] hyjeongdetection_of_recombination_in_bacterial_genomes [2021/03/17 13:09] (current) – external edit 127.0.0.1
Line 28: Line 28:
   /data/anaconda2/bin/freebayes-parallel: line 40: ../vcflib/scripts/vcffirstheader: 그런 파일이나 디렉터리가 없습니다   /data/anaconda2/bin/freebayes-parallel: line 40: ../vcflib/scripts/vcffirstheader: 그런 파일이나 디렉터리가 없습니다
      
-/data/anaconda2/bin/freebayes-parallel의 40번째 라인을 찾아가서 위 두 가지 유틸리티 앞에 붙은 상대경로를 지워버렸다. 이렇게 하니 비로소 정상적인 실행이 되었다.+/data/anaconda2/bin/freebayes-parallel의 40번째 라인을 찾아가서 위 두 가지 유틸리티 앞에 붙은 상대경로를 지워버렸다. 이렇게 하니 비로소 정상적인 실행이 되었다. 일반적인 실행 방법은 다음과 같다.
  
 +  $ snippy --cpus 16 --outdir mysnps --ref E_coli.gbk --R1 read_1.fastq.gz --R2 read_2.fastq.gz
 +  $ snippy-core --prefix core mysnps1 mysnps2 mysnps2 
 +snippy-core 결과물인 core.full.aln(whole genome SNP alignment including invariant sites)을 gubbins에 이용하면 된다.
 ==== Harvest suite (parsnp) ==== ==== Harvest suite (parsnp) ====
 [[http://harvest.readthedocs.io/en/latest/index.html|Harvest suite]]는 동일 종에 속하는 미생물 유전체를 신속하게 비교하여 core-genome alignment를 만들고 시각화하는 도구이다.  [[http://harvest.readthedocs.io/en/latest/index.html|Harvest suite]]는 동일 종에 속하는 미생물 유전체를 신속하게 비교하여 core-genome alignment를 만들고 시각화하는 도구이다. 
Line 42: Line 45:
 이렇게 만들어진 multiFASTA 파일을 gubbins에 입력물로 제공해도 실행에는 문제가 없다. 그러나 LCB(locally collinear block)을 갭 없이 이어붙인 것이라서 원래의 좌표 정보가 더 이상 유효하지 않다. parsnp.xmfa를 정밀하게 parsing하면 reference coordinate에 맞추어서 각 LCB 사이에 알맞은 길이의 gap을 넣어서 연결한 서열을 만드는 것이 가능할지도 모른다. 하지만 그렇게 하느니 처음부터 whole genome alignment를 만드는 snippy를 쓰는 것이 바람직할 것이다. 이렇게 만들어진 multiFASTA 파일을 gubbins에 입력물로 제공해도 실행에는 문제가 없다. 그러나 LCB(locally collinear block)을 갭 없이 이어붙인 것이라서 원래의 좌표 정보가 더 이상 유효하지 않다. parsnp.xmfa를 정밀하게 parsing하면 reference coordinate에 맞추어서 각 LCB 사이에 알맞은 길이의 gap을 넣어서 연결한 서열을 만드는 것이 가능할지도 모른다. 하지만 그렇게 하느니 처음부터 whole genome alignment를 만드는 snippy를 쓰는 것이 바람직할 것이다.
 ===== Gubbins ===== ===== Gubbins =====
 +  * [논문] Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. Nucl Acid Res 2015 [[https://www.ncbi.nlm.nih.gov/pubmed/25414349|PubMed]]
 +  * [[https://www.sanger.ac.uk/science/tools/gubbinshttps://www.sanger.ac.uk/science/tools/gubbins|웹사이트]] [[https://github.com/sanger-pathogens/gubbins|GitHub]]
 +BioConda 패키지를 이용하여 설치하였다(py35 environment).
  
 +  $ run_gubbins.py dataset.aln
 +  $ gubbins_drawer.py -o result.pdf dataset.final_tree.tre dataset.recombination_predictions.embl
 +  $ gubbins_drawer.py -o results_SNPS.pdf dataset.final_tree.tre dataset.branch_base_reconstruction.embl
 ===== Visualization using phandango ===== ===== Visualization using phandango =====
  
detection_of_recombination_in_bacterial_genomes.1529039239.txt.gz · Last modified: (external edit)