bioinfo:계통수_작성하기
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:계통수_작성하기 [2023/08/12 11:40] – [계통수 작성하기] hyjeong | bioinfo:계통수_작성하기 [2025/02/23 12:57] (current) – [Species level을 벗어나는 genome의 MSA를 얻으려면 - ezTree] hyjeong | ||
---|---|---|---|
Line 7: | Line 7: | ||
정렬된 MSA 자료의 조작에는 [[https:// | 정렬된 MSA 자료의 조작에는 [[https:// | ||
+ | ===== Species level을 벗어나는 genome의 MSA를 얻으려면 - ezTree ===== | ||
+ | Roary는 하나의 species에 속하는 균주 유전체를 대상으로 core gene group을 동정한 뒤 이로부터 MSA를 생성해 낸다. 만약 분석 대상 미생물이 여러 species에 걸쳐 있다면 core gene이 잘 형성되지 않으므로 원하는 결과를 얻기 어렵다. 나는 이러한 상황에서는 [[https:// | ||
+ | 51개 // | ||
+ | |||
+ | #FASTA file의 목록을 먼저 만든다. | ||
+ | $ find fasta_230812.51 -type f > list_230812.51 | ||
+ | $ cat list_230812.51 | ||
+ | fasta_230812.51/ | ||
+ | fasta_230812.51/ | ||
+ | fasta_230812.51/ | ||
+ | ... | ||
+ | #30개 스레드를 사용한다. | ||
+ | #트리 모델은 JTT를 기본으로 한다. | ||
+ | # Ryzen server: / | ||
+ | (base) $ nohup ./ | ||
+ | $ ls -l | grep run_230812 | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong 7941159 | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong | ||
+ | drwxrwxr-x 2 hyjeong hyjeong | ||
+ | |||
+ | Newick 파일에서 각 leaf label은 최초에 투입한 FASTA file명(예: | ||
===== MSA로부터 newick file 만들어 보기 ===== | ===== MSA로부터 newick file 만들어 보기 ===== | ||
- | MSA로부터 간단하게 계통수를 만드는 방법은 다음과 같다. | + | Roary가 생성한 |
$ trimal -in core_gene_alignment.aln -out core_gene_alignment.aln.trim -automated1 | $ trimal -in core_gene_alignment.aln -out core_gene_alignment.aln.trim -automated1 |
bioinfo/계통수_작성하기.1691808010.txt.gz · Last modified: 2023/08/12 11:40 by hyjeong