bioinfo:anvio
Differences
This shows you the differences between two versions of the page.
bioinfo:anvio [2018/07/10 15:48] – [Pangenomics] hyjeong | bioinfo:anvio [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 5: | Line 5: | ||
* Anvi'o project page http:// | * Anvi'o project page http:// | ||
* v5.1 " | * v5.1 " | ||
- | * 현재 bioconda로 설치되는 최신 버전은 v4.0이다. | + | * 현재 bioconda로 설치되는 최신 버전은 v4.0이다. |
Line 46: | Line 46: | ||
python 2.7과 3.x 중 어느것을 기반으로 하느냐에 따라서 db의 버전도 달라진다. Python 3.x 환경에서는 contigs database version이 10으로 바뀌면서 .h5 파일은 쓰이지 않게 된다. 정 문제가 해결되지 않으면 docker image를 써서 실행하자. | python 2.7과 3.x 중 어느것을 기반으로 하느냐에 따라서 db의 버전도 달라진다. Python 3.x 환경에서는 contigs database version이 10으로 바뀌면서 .h5 파일은 쓰이지 않게 된다. 정 문제가 해결되지 않으면 docker image를 써서 실행하자. | ||
- | ===== Docker image 이용하기 ===== | + | ===== [강력 추천!] |
Anvi' | Anvi' | ||
Line 70: | Line 70: | ||
===== Anvi' | ===== Anvi' | ||
+ | ==== 개요 ==== | ||
+ | |||
[[http:// | [[http:// | ||
+ | |||
+ | COG annotation을 한 다음에는 genomes storage를 다시 만들어서 기능 관련 정보가 채워야 한다. | ||
데이터베이스는 전부 파일로 저장된다. Contigs database에는 각 contig에 부속되는 정보, 즉 k-mer frequency, 20 kb 단위의 soft split, ORF 예측 결과 등이 수록된다([[http:// | 데이터베이스는 전부 파일로 저장된다. Contigs database에는 각 contig에 부속되는 정보, 즉 k-mer frequency, 20 kb 단위의 soft split, ORF 예측 결과 등이 수록된다([[http:// | ||
Line 80: | Line 84: | ||
anvi-script-FASTA-to-contigs-db $i | anvi-script-FASTA-to-contigs-db $i | ||
done | done | ||
+ | (# 필요하다면 anvi-run-ncbi-cogs을 이 단계에서 한다) | ||
$ anvi-gen-genomes-storage -e external-genomes.txt \ | $ anvi-gen-genomes-storage -e external-genomes.txt \ | ||
-o ALL_GENOMES.h5 (or ALL_GENOMES.db) | -o ALL_GENOMES.h5 (or ALL_GENOMES.db) | ||
Line 101: | Line 106: | ||
$ anvi-pan-genome -g ALL_GENOMES.db -n PANGENOMES | $ anvi-pan-genome -g ALL_GENOMES.db -n PANGENOMES | ||
- | -n 뒤에 기입하는 것은 PROJECT_NAME으로서 실제로는 이 이름의 디렉토리가 생긴다. 그 하위에 PANGENOMES-PAN.db라는 별도의 DB가 생기는 것이다. 결과를 interactive하게 보려면 다음과 같이 실행한다. | + | -n 뒤에 기입하는 것은 PROJECT_NAME으로서 실제로는 이 이름의 디렉토리가 생긴다. 그 하위에 PANGENOMES-PAN.db라는 별도의 DB가 생기는 것이다. 결과를 interactive하게 보려면 다음과 같이 실행한다. 동일 컴퓨터에서 웹브라우저를 띄우는 것보다 다른 컴퓨터(MS-윈도우)에서 크롬으로 접속하는 것이 훨씬 빠르다. |
$ anvi-display-pan -p PANGENOMES/ | $ anvi-display-pan -p PANGENOMES/ | ||
+ | Anvi's interactive interface에 대한 상세한 설명은 [[http:// | ||
| | ||
Average nucleotide identity(ANI) 분석도 실시할 수 있다. | Average nucleotide identity(ANI) 분석도 실시할 수 있다. | ||
Line 114: | Line 120: | ||
ANI 분석 결과물의 시각화는 똑같이 anvi-display-pan 명령을 사용한다. 처음에는 ANI 분석 결과가 보이지 않는다. 놀라지 말고 Layout 탭으로 가서 시각화하고 싶은 정보의 체크박스를 클릭한 뒤 Draw를 클릭하라. | ANI 분석 결과물의 시각화는 똑같이 anvi-display-pan 명령을 사용한다. 처음에는 ANI 분석 결과가 보이지 않는다. 놀라지 말고 Layout 탭으로 가서 시각화하고 싶은 정보의 체크박스를 클릭한 뒤 Draw를 클릭하라. | ||
+ | |||
+ | === External gene call 정보를 이용하기 ==== | ||
+ | |||
+ | 윗부분 ' | ||
+ | |||
+ | === Layer란? === | ||
+ | [[http:// | ||
+ | |||
+ | Anvi' | ||
=== Gene cluster 탐색하기 === | === Gene cluster 탐색하기 === | ||
Line 155: | Line 170: | ||
anvi-run-ncbi-cogs -c $i --num-threads 20 | anvi-run-ncbi-cogs -c $i --num-threads 20 | ||
done | done | ||
- | COG data directory의 기본 위치는 / | + | COG data directory의 기본 위치는 / |
==== 기타 노하우 ==== | ==== 기타 노하우 ==== |
bioinfo/anvio.1531205294.txt.gz · Last modified: (external edit)