====== 상동유전자의 동정(inter-species) ====== 이전 단원에서 소개한 pan-genome은 미생물의 종 내, 즉 intra-species level(inter-strain)에서 정의되는 개념이므로, 종 경계를 넘어서는 생명체의 유전체를 서로 비교하여 공통적으로 존재하는 유전자를 찾아내려면 다른 방법을 사용해야 한다. [[https://genome.cshlp.org/content/13/9/2178.full|OrthoMCL]]은 Markov clustering을 이용하여 종간의 상동유전자를 클러스터링하는 매우 고전적인 도구이다. 지금은 이 도구를 이용하여 구축된 데이터베이스인 [[https://orthomcl.org/orthomcl/app/|OrthoMCL DB]]가 더 중요하게 취급되는 것 같다. OrthoMCL v1.2는 [[https://sourceforge.net/projects/orthomcl/|SourceForge]]에서 제공한다. v1.4는 공식 [[https://orthomcl.org/common/downloads/software/unsupported/v1.4/|웹사이트]]에서 제공한다. 2011년에 공개된 v2.0부터는 MySQL을 이용하는 것으로 바뀌었다. ===== OrthoMCL v1.4 사용하기 ===== [[https://orthomcl.org/common/downloads/software/unsupported/v1.4/ORTHOMCL_V1.4_mcl-02-063.tar|ORTHOMCL__V1.4_mcl-02-063.tar]]를 다운로드하여 압축을 해제하면 orthomcl.pl 스크립트와 orthomcl_module.pm 모듈이 나올 것이다. README 파일의 2번 항목을 참조하여 orthomcl_module.pm 파일을 수정한 뒤 현 작업 디렉토리에 둔다. 특히 작업 디렉토리와 샘플 파일 디렉토리를 이 파일에서 정확하게 설정해야 한다. 가장 간단한 작동 모드(--mode 1)로 실행하려면 legacy BLAST을 사용해야 한다. 결과물은 06._05., 06._05._2와 같이 작업 디렉토리에 자동으로 생성된 월._일._일련번호 형태의 하위 디렉토리에 기록된다. $ orthomcl.pl --mode 1 --fa_files Ath.fa,Hsa.fa,Sce.fa ===== OrthoFinder 및 기타 소프트웨어 ===== OrthoMCL보다는 더욱 진일보한 소프트웨어인 [[https://github.com/davidemms/OrthoFinder|OrthoFinder]]를 사용할 것을 권장한다. 대용량 분석에는 [[http://legacy.bioinf.uni-leipzig.de/Software/proteinortho/|Proteinortho]]를 검토해 봄직하나, 이것 역시 legacy software가 되었다.