bioinfo:유전체_주석화_genome_annotation
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| bioinfo:유전체_주석화_genome_annotation [2023/06/29 11:07] – [InterProScan 결과물의 시각화] hyjeong | bioinfo:유전체_주석화_genome_annotation [2025/07/29 08:15] (current) – [Bakta] hyjeong | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== 유전체 주석화(genome annotation) ====== | ====== 유전체 주석화(genome annotation) ====== | ||
| + | |||
| + | [[prokaryotic_genome_analysis_manual_2023|상위 페이지 - Prokaryotic genome analysis manual]] | ||
| + | |||
| 주석화 결과를 외부와 공유하고 관련 유전체와 비교 분석을 할 목적이라면 [[https:// | 주석화 결과를 외부와 공유하고 관련 유전체와 비교 분석을 할 목적이라면 [[https:// | ||
| ===== Prokka 사용하기 ===== | ===== Prokka 사용하기 ===== | ||
| Line 9: | Line 12: | ||
| 일본에서 개발한 DFAST(DDBJ Fast Annotation and Submission)의 stand-alone version인 [[https:// | 일본에서 개발한 DFAST(DDBJ Fast Annotation and Submission)의 stand-alone version인 [[https:// | ||
| + | ===== Bakta ===== | ||
| + | Bakta([[https:// | ||
| ===== PGAP 사용하기 ===== | ===== PGAP 사용하기 ===== | ||
| - | Prokaryotic Genome Annotation System(PGAP, | + | Prokaryotic Genome Annotation System(PGAP, |
| # 현재 배포 중인 PGAP의 최신 버전 확인하기 | # 현재 배포 중인 PGAP의 최신 버전 확인하기 | ||
| $ curl --silent " | $ curl --silent " | ||
| $ cat VERSION | $ cat VERSION | ||
| - | | + | |
| - | PGAP은 docker 환경을 사용하므로, | + | PGAP은 docker 환경을 사용하므로, |
| # docker가 실행 중인지 확인 | # docker가 실행 중인지 확인 | ||
| Line 243: | Line 248: | ||
| 이제부터의 작업은 R에서 실시한다. 모든 *.tsv.txt 파일을 모아서 하나로 병합한 뒤 results.txt 파일에 저장한다. | 이제부터의 작업은 R에서 실시한다. 모든 *.tsv.txt 파일을 모아서 하나로 병합한 뒤 results.txt 파일에 저장한다. | ||
| - | + | ||
| rm(list=ls()) | rm(list=ls()) | ||
| list.filenames = list.files(pattern=" | list.filenames = list.files(pattern=" | ||
| Line 378: | Line 383: | ||
| eggNOG ([[https:// | eggNOG ([[https:// | ||
| + | |||
| + | eggNOG-mapper의 기본적인 사용법은 다음과 같다. CPU 수를 지정하지 않으면 2개를 사용한다. | ||
| + | |||
| + | $ python / | ||
| + | … | ||
| + | Done | ||
| + | | ||
| + | | ||
| + | Total time: 1551.87 secs | ||
| + | |||
| + | Query 서열에 대한 주석 정보는 22개의 컬럼으로 이루어진 .annotations 파일에 기록된다. 각 컬럼에 대한 설명은 다음과 같다. | ||
| + | |||
| + | - query_name | ||
| + | - seed eggNOG ortholog | ||
| + | - seed ortholog evalue | ||
| + | - seed ortholog score | ||
| + | - Predicted taxonomic group | ||
| + | - Predicted protein name | ||
| + | - Gene Ontology terms | ||
| + | - EC numberKEGG_ko | ||
| + | - KEGG_Pathway | ||
| + | - KEGG_Module | ||
| + | - KEGG_ReactionKEGG_rclass | ||
| + | - BRITE | ||
| + | - KEGG_TC | ||
| + | - CAZy | ||
| + | - BiGG Reaction | ||
| + | - tax_scope: eggNOG taxonomic level used for annotation | ||
| + | - eggNOG OGs | ||
| + | - bestOG (deprecated, | ||
| + | - COG Functional Category | ||
| + | - eggNOG free text description | ||
| + | |||
| + | eggNOG mapper에서 출력한 annotation 파일에서 KEGG ko 번호(KEGG orthology)를 추출하면 [[https:// | ||
| + | |||
| + | $ awk -F" | ||
| ===== Genomic island 예측 ===== | ===== Genomic island 예측 ===== | ||
| [[https:// | [[https:// | ||
| ===== 항생제 내성 유전자(AMR determinant)의 예측 ===== | ===== 항생제 내성 유전자(AMR determinant)의 예측 ===== | ||
| + | ===== ResFinder 사용하기 ===== | ||
| + | 항생제 내성 유전자 DB 및 분석 툴로서 대표적인 것은 맥마스터 대학교의 [[https:// | ||
| + | $ mkdir out_all out | ||
| + | $ resfinder.py -i test.fsa -p / | ||
| + | $ resfinder.py -i test.fsa -p / | ||
| + | | ||
| + | CGE 웹사이트에서 서비스하는 것은 resfinder.pl 스크립트이다. 이것은 실행 옵션이 다르고(예: | ||
| ====ABRicate를 이용한 항생제 내성 병원성 인자(virulence factor) 유전자 예측 ==== | ====ABRicate를 이용한 항생제 내성 병원성 인자(virulence factor) 유전자 예측 ==== | ||
| + | [[https:// | ||
| - | ===== 이차대사물 생합성 유전자(biosynthetic gene cluster, BGC) 예측 | + | $ abricate --list |
| + | DATABASE SEQUENCES DBTYPE DATE | ||
| + | ecoh 597 nucl 2018-Oct-20 | ||
| + | card 2237 nucl 2018-Oct-20 | ||
| + | ncbi 4579 nucl 2018-Oct-20 | ||
| + | vfdb 2597 nucl 2018-Oct-20 | ||
| + | plasmidfinder 263 nucl 2018-Oct-20 | ||
| + | resfinder 3021 nucl 2018-Oct-20 | ||
| + | ecoli_vf 2701 nucl 2018-Oct-20 | ||
| + | argannot 1749 nucl 2018-Oct-20 | ||
| + | $ abricate -db card contigs.fa | ||
| + | Using nucl database card: 2237 sequences - 2018-Oct-20 | ||
| + | # | ||
| + | Processing: contigs.fa | ||
| + | Found 5 genes in contigs.fa | ||
| + | contigs.fa Enterococcus 514111 515397 efmA 1-1287/ | ||
| + | contigs.fa Enterococcus 1922156 1923199 efrB 45-1086/ | ||
| + | contigs.fa Enterococcus 1923857 1925292 efrA 1-1434/ | ||
| + | contigs.fa Enterococcus 2040199 2040747 AAC(6')-Ii 1-549/ | ||
| + | contigs.fa Enterococcus 2426678 2428156 msrC 1-1479/ | ||
| + | 여러 샘플에 대하여 ABRicate를 실행하였다면 abricate --summary 옵션을 이용하여 gene presence/ | ||
| + | ===== 이차대사물 생합성 유전자(biosynthetic gene cluster, BGC) 예측 ===== | ||
| + | [[https:// | ||
bioinfo/유전체_주석화_genome_annotation.1688004478.txt.gz · Last modified: by hyjeong
