이전 단원에서 소개한 pan-genome은 미생물의 종 내, 즉 intra-species level(inter-strain)에서 정의되는 개념이므로, 종 경계를 넘어서는 생명체의 유전체를 서로 비교하여 공통적으로 존재하는 유전자를 찾아내려면 다른 방법을 사용해야 한다. OrthoMCL은 Markov clustering을 이용하여 종간의 상동유전자를 클러스터링하는 매우 고전적인 도구이다. 지금은 이 도구를 이용하여 구축된 데이터베이스인 OrthoMCL DB가 더 중요하게 취급되는 것 같다. OrthoMCL v1.2는 SourceForge에서 제공한다. v1.4는 공식 웹사이트에서 제공한다. 2011년에 공개된 v2.0부터는 MySQL을 이용하는 것으로 바뀌었다.
ORTHOMCL__V1.4_mcl-02-063.tar를 다운로드하여 압축을 해제하면 orthomcl.pl 스크립트와 orthomcl_module.pm 모듈이 나올 것이다. README 파일의 2번 항목을 참조하여 orthomcl_module.pm 파일을 수정한 뒤 현 작업 디렉토리에 둔다. 특히 작업 디렉토리와 샘플 파일 디렉토리를 이 파일에서 정확하게 설정해야 한다. 가장 간단한 작동 모드(–mode 1)로 실행하려면 legacy BLAST을 사용해야 한다. 결과물은 06._05., 06._05._2와 같이 작업 디렉토리에 자동으로 생성된 월._일._일련번호 형태의 하위 디렉토리에 기록된다.
$ orthomcl.pl --mode 1 --fa_files Ath.fa,Hsa.fa,Sce.fa
OrthoMCL보다는 더욱 진일보한 소프트웨어인 OrthoFinder를 사용할 것을 권장한다.
대용량 분석에는 Proteinortho를 검토해 봄직하나, 이것 역시 legacy software가 되었다.