bioinfo:유전체_주석화_genome_annotation
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:유전체_주석화_genome_annotation [2023/06/29 11:07] – [InterProScan 결과물의 시각화] hyjeong | bioinfo:유전체_주석화_genome_annotation [2024/08/05 15:12] (current) – [PGAP 사용하기] hyjeong | ||
---|---|---|---|
Line 10: | Line 10: | ||
===== PGAP 사용하기 ===== | ===== PGAP 사용하기 ===== | ||
- | Prokaryotic Genome Annotation System(PGAP, | + | Prokaryotic Genome Annotation System(PGAP, |
# 현재 배포 중인 PGAP의 최신 버전 확인하기 | # 현재 배포 중인 PGAP의 최신 버전 확인하기 | ||
$ curl --silent " | $ curl --silent " | ||
$ cat VERSION | $ cat VERSION | ||
- | | + | |
PGAP은 docker 환경을 사용하므로, | PGAP은 docker 환경을 사용하므로, | ||
Line 243: | Line 243: | ||
이제부터의 작업은 R에서 실시한다. 모든 *.tsv.txt 파일을 모아서 하나로 병합한 뒤 results.txt 파일에 저장한다. | 이제부터의 작업은 R에서 실시한다. 모든 *.tsv.txt 파일을 모아서 하나로 병합한 뒤 results.txt 파일에 저장한다. | ||
- | + | ||
rm(list=ls()) | rm(list=ls()) | ||
list.filenames = list.files(pattern=" | list.filenames = list.files(pattern=" | ||
Line 378: | Line 378: | ||
eggNOG ([[https:// | eggNOG ([[https:// | ||
+ | |||
+ | eggNOG-mapper의 기본적인 사용법은 다음과 같다. CPU 수를 지정하지 않으면 2개를 사용한다. | ||
+ | |||
+ | $ python / | ||
+ | … | ||
+ | Done | ||
+ | | ||
+ | | ||
+ | Total time: 1551.87 secs | ||
+ | |||
+ | Query 서열에 대한 주석 정보는 22개의 컬럼으로 이루어진 .annotations 파일에 기록된다. 각 컬럼에 대한 설명은 다음과 같다. | ||
+ | |||
+ | - query_name | ||
+ | - seed eggNOG ortholog | ||
+ | - seed ortholog evalue | ||
+ | - seed ortholog score | ||
+ | - Predicted taxonomic group | ||
+ | - Predicted protein name | ||
+ | - Gene Ontology terms | ||
+ | - EC numberKEGG_ko | ||
+ | - KEGG_Pathway | ||
+ | - KEGG_Module | ||
+ | - KEGG_ReactionKEGG_rclass | ||
+ | - BRITE | ||
+ | - KEGG_TC | ||
+ | - CAZy | ||
+ | - BiGG Reaction | ||
+ | - tax_scope: eggNOG taxonomic level used for annotation | ||
+ | - eggNOG OGs | ||
+ | - bestOG (deprecated, | ||
+ | - COG Functional Category | ||
+ | - eggNOG free text description | ||
+ | |||
+ | eggNOG mapper에서 출력한 annotation 파일에서 KEGG ko 번호(KEGG orthology)를 추출하면 [[https:// | ||
+ | |||
+ | $ awk -F" | ||
===== Genomic island 예측 ===== | ===== Genomic island 예측 ===== | ||
[[https:// | [[https:// | ||
===== 항생제 내성 유전자(AMR determinant)의 예측 ===== | ===== 항생제 내성 유전자(AMR determinant)의 예측 ===== | ||
+ | ===== ResFinder 사용하기 ===== | ||
+ | 항생제 내성 유전자 DB 및 분석 툴로서 대표적인 것은 맥마스터 대학교의 [[https:// | ||
+ | $ mkdir out_all out | ||
+ | $ resfinder.py -i test.fsa -p / | ||
+ | $ resfinder.py -i test.fsa -p / | ||
+ | | ||
+ | CGE 웹사이트에서 서비스하는 것은 resfinder.pl 스크립트이다. 이것은 실행 옵션이 다르고(예: | ||
====ABRicate를 이용한 항생제 내성 병원성 인자(virulence factor) 유전자 예측 ==== | ====ABRicate를 이용한 항생제 내성 병원성 인자(virulence factor) 유전자 예측 ==== | ||
+ | [[https:// | ||
- | ===== 이차대사물 생합성 유전자(biosynthetic gene cluster, BGC) 예측 | + | $ abricate --list |
+ | DATABASE SEQUENCES DBTYPE DATE | ||
+ | ecoh 597 nucl 2018-Oct-20 | ||
+ | card 2237 nucl 2018-Oct-20 | ||
+ | ncbi 4579 nucl 2018-Oct-20 | ||
+ | vfdb 2597 nucl 2018-Oct-20 | ||
+ | plasmidfinder 263 nucl 2018-Oct-20 | ||
+ | resfinder 3021 nucl 2018-Oct-20 | ||
+ | ecoli_vf 2701 nucl 2018-Oct-20 | ||
+ | argannot 1749 nucl 2018-Oct-20 | ||
+ | $ abricate -db card contigs.fa | ||
+ | Using nucl database card: 2237 sequences - 2018-Oct-20 | ||
+ | # | ||
+ | Processing: contigs.fa | ||
+ | Found 5 genes in contigs.fa | ||
+ | contigs.fa Enterococcus 514111 515397 efmA 1-1287/ | ||
+ | contigs.fa Enterococcus 1922156 1923199 efrB 45-1086/ | ||
+ | contigs.fa Enterococcus 1923857 1925292 efrA 1-1434/ | ||
+ | contigs.fa Enterococcus 2040199 2040747 AAC(6')-Ii 1-549/ | ||
+ | contigs.fa Enterococcus 2426678 2428156 msrC 1-1479/ | ||
+ | 여러 샘플에 대하여 ABRicate를 실행하였다면 abricate --summary 옵션을 이용하여 gene presence/ | ||
+ | ===== 이차대사물 생합성 유전자(biosynthetic gene cluster, BGC) 예측 ===== | ||
+ | [[https:// | ||
bioinfo/유전체_주석화_genome_annotation.1688004478.txt.gz · Last modified: 2023/06/29 11:07 by hyjeong