bioinfo:계통수_작성하기
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:계통수_작성하기 [2023/08/12 18:08] – [Whole-genome 수준의 MSA를 얻으려면 - ezTree] hyjeong | bioinfo:계통수_작성하기 [2025/02/23 12:57] (current) – [Species level을 벗어나는 genome의 MSA를 얻으려면 - ezTree] hyjeong | ||
---|---|---|---|
Line 7: | Line 7: | ||
정렬된 MSA 자료의 조작에는 [[https:// | 정렬된 MSA 자료의 조작에는 [[https:// | ||
- | ===== Species level을 벗어나는 genome | + | ===== Species level을 벗어나는 genome의 MSA를 얻으려면 - ezTree ===== |
- | Roary는 하나의 species에 속하는 균주 유전체를 대상으로 core gene group을 동정한 뒤 이로부터 MSA를 생성해 낸다. 만약 분석 대상 미생물이 여러 species에 걸쳐 있다면 core gene이 잘 형성되지 않으므로 원하는 결과를 얻기 어렵다. 나는 이러한 상황에서는 [[https:// | + | Roary는 하나의 species에 속하는 균주 유전체를 대상으로 core gene group을 동정한 뒤 이로부터 MSA를 생성해 낸다. 만약 분석 대상 미생물이 여러 species에 걸쳐 있다면 core gene이 잘 형성되지 않으므로 원하는 결과를 얻기 어렵다. 나는 이러한 상황에서는 [[https:// |
- | 51개 // | + | 51개 // |
+ | #FASTA file의 목록을 먼저 만든다. | ||
+ | $ find fasta_230812.51 -type f > list_230812.51 | ||
+ | $ cat list_230812.51 | ||
+ | fasta_230812.51/ | ||
+ | fasta_230812.51/ | ||
+ | fasta_230812.51/ | ||
+ | ... | ||
+ | #30개 스레드를 사용한다. | ||
+ | #트리 모델은 JTT를 기본으로 한다. | ||
+ | # Ryzen server: / | ||
+ | (base) $ nohup ./ | ||
+ | $ ls -l | grep run_230812 | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong 7941159 | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong | ||
+ | -rw-rw-r-- 1 hyjeong hyjeong | ||
+ | drwxrwxr-x 2 hyjeong hyjeong | ||
+ | |||
+ | Newick 파일에서 각 leaf label은 최초에 투입한 FASTA file명(예: | ||
===== MSA로부터 newick file 만들어 보기 ===== | ===== MSA로부터 newick file 만들어 보기 ===== | ||
bioinfo/계통수_작성하기.1691831299.txt.gz · Last modified: 2023/08/12 18:08 by hyjeong