bioinfo:계통수_작성하기
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| bioinfo:계통수_작성하기 [2023/08/11 09:59] – [IQ-TREE로 maximum likelihood를 이용한 계통분류학적 추론하기] hyjeong | bioinfo:계통수_작성하기 [2025/02/23 12:57] (current) – [Species level을 벗어나는 genome의 MSA를 얻으려면 - ezTree] hyjeong | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== 계통수 작성하기 ====== | ====== 계통수 작성하기 ====== | ||
| - | Roary 또는 다른 multiple sequence alignment(MSA) 소프트웨어로 만들어진 염기서열 정렬 결과물을 [[http:// | + | Roary 또는 다른 multiple sequence alignment(MSA) 소프트웨어로 만들어진 |
| Alignment로부터 불량한 곳을 제거하려면 trimAl 이외에도 Gblocks를 쓸 수 있다. [[https:// | Alignment로부터 불량한 곳을 제거하려면 trimAl 이외에도 Gblocks를 쓸 수 있다. [[https:// | ||
| Line 7: | Line 7: | ||
| 정렬된 MSA 자료의 조작에는 [[https:// | 정렬된 MSA 자료의 조작에는 [[https:// | ||
| - | MSA로부터 간단하게 계통수를 만드는 방법은 | + | ===== Species level을 벗어나는 genome의 |
| + | Roary는 하나의 species에 속하는 균주 유전체를 대상으로 core gene group을 동정한 뒤 이로부터 | ||
| - | $ trimal | + | 51개 // |
| - | $ fasttree | + | |
| + | #FASTA file의 목록을 먼저 만든다. | ||
| + | $ find fasta_230812.51 -type f > list_230812.51 | ||
| + | $ cat list_230812.51 | ||
| + | fasta_230812.51/ | ||
| + | fasta_230812.51/ | ||
| + | fasta_230812.51/ | ||
| + | ... | ||
| + | #30개 스레드를 사용한다. | ||
| + | #트리 모델은 JTT를 기본으로 한다. | ||
| + | # Ryzen server: / | ||
| + | (base) $ nohup ./ | ||
| + | $ ls -l | grep run_230812 | ||
| + | -rw-rw-r-- 1 hyjeong hyjeong 7941159 | ||
| + | -rw-rw-r-- 1 hyjeong hyjeong | ||
| + | -rw-rw-r-- 1 hyjeong hyjeong | ||
| + | drwxrwxr-x 2 hyjeong hyjeong | ||
| + | |||
| + | Newick 파일에서 각 leaf label은 최초에 투입한 FASTA file명(예: | ||
| + | ===== MSA로부터 newick file 만들어 보기 ===== | ||
| + | |||
| + | |||
| + | Roary가 생성한 MSA(core_gene_alignment.aln)로부터 간단하게 계통수를 만드는 방법은 다음과 같다. | ||
| + | |||
| + | | ||
| + | $ fasttree | ||
| | | ||
| 세균의 유전체 진화에서는 horizontal gene transfer(HGT)가 매우 빈번히 일어난다. HGT로 유입된 영역을 제거하지 않으면 정확한 계통수를 작성하기가 어려워질 수 있다. 이를 위해 [[https:// | 세균의 유전체 진화에서는 horizontal gene transfer(HGT)가 매우 빈번히 일어난다. HGT로 유입된 영역을 제거하지 않으면 정확한 계통수를 작성하기가 어려워질 수 있다. 이를 위해 [[https:// | ||
| Line 16: | Line 42: | ||
| Newick 포맷의 파일은 [[http:// | Newick 포맷의 파일은 [[http:// | ||
| - | ===== R에서 트리 | + | ===== R에서 트리 |
| R에서 tree file을 다루려면 ape package를 사용하면 된다. | R에서 tree file을 다루려면 ape package를 사용하면 된다. | ||
bioinfo/계통수_작성하기.1691715556.txt.gz · Last modified: by hyjeong
