세균 유전체의 SNP 발굴용 프로그램 성능 비교(논문)

SNP 발굴은 적합한 참조 유전체 서열의 선정, read의 매핑, variant calling에 이르기까지 몇 개의 단계를 거쳐서 진행되는데, 앞에서 일부 소개했듯이 각각에 대하여 사용할 수 있는 프로그램의 조합이 대단히 많고 그 성능도 전부 다르다. 이를 벤치마킹하는 연구는 주로 인간 유전체를 대상으로 이루어지고 있는 현실이다. 다음의 논문은 세균을 대상으로 하는 SNP calling 기법들을 서로 비교하고 있다. 각 논문에 딸린 supplementary material에는 simulated data 생성과 분석에 필요한 명령어가 들어 있어서 참조하기에 좋다.

Evaluation of SNP calling methods for closely related bacterial isolates and a novel high-accuracy pipeline: BactSNP. Microbial Genomics (2019) https://doi.org/10.1099/mgen.0.000261

Genomic diversity affects the accuracy of bacterial single-nucleotide polymorphism–calling pipelines. GigaScience (2020) https://doi.org/10.1093/gigascience/giaa007

Standardized phylogenetic and molecular evolutionary (PhaME) analysis applied across the microbial tree of life. Scientific Reports (2020) https://doi.org/10.1038/s41598-020-58356-1