bioinfo:anvio
Differences
This shows you the differences between two versions of the page.
bioinfo:anvio [2018/07/10 15:28] – [Pangenomics] hyjeong | bioinfo:anvio [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 5: | Line 5: | ||
* Anvi'o project page http:// | * Anvi'o project page http:// | ||
* v5.1 " | * v5.1 " | ||
- | * 현재 bioconda로 설치되는 최신 버전은 v4.0이다. | + | * 현재 bioconda로 설치되는 최신 버전은 v4.0이다. |
Line 46: | Line 46: | ||
python 2.7과 3.x 중 어느것을 기반으로 하느냐에 따라서 db의 버전도 달라진다. Python 3.x 환경에서는 contigs database version이 10으로 바뀌면서 .h5 파일은 쓰이지 않게 된다. 정 문제가 해결되지 않으면 docker image를 써서 실행하자. | python 2.7과 3.x 중 어느것을 기반으로 하느냐에 따라서 db의 버전도 달라진다. Python 3.x 환경에서는 contigs database version이 10으로 바뀌면서 .h5 파일은 쓰이지 않게 된다. 정 문제가 해결되지 않으면 docker image를 써서 실행하자. | ||
- | ===== Docker image 이용하기 ===== | + | ===== [강력 추천!] |
Anvi' | Anvi' | ||
Line 70: | Line 70: | ||
===== Anvi' | ===== Anvi' | ||
+ | ==== 개요 ==== | ||
+ | |||
[[http:// | [[http:// | ||
+ | |||
+ | COG annotation을 한 다음에는 genomes storage를 다시 만들어서 기능 관련 정보가 채워야 한다. | ||
데이터베이스는 전부 파일로 저장된다. Contigs database에는 각 contig에 부속되는 정보, 즉 k-mer frequency, 20 kb 단위의 soft split, ORF 예측 결과 등이 수록된다([[http:// | 데이터베이스는 전부 파일로 저장된다. Contigs database에는 각 contig에 부속되는 정보, 즉 k-mer frequency, 20 kb 단위의 soft split, ORF 예측 결과 등이 수록된다([[http:// | ||
Line 80: | Line 84: | ||
anvi-script-FASTA-to-contigs-db $i | anvi-script-FASTA-to-contigs-db $i | ||
done | done | ||
+ | (# 필요하다면 anvi-run-ncbi-cogs을 이 단계에서 한다) | ||
$ anvi-gen-genomes-storage -e external-genomes.txt \ | $ anvi-gen-genomes-storage -e external-genomes.txt \ | ||
-o ALL_GENOMES.h5 (or ALL_GENOMES.db) | -o ALL_GENOMES.h5 (or ALL_GENOMES.db) | ||
Line 101: | Line 106: | ||
$ anvi-pan-genome -g ALL_GENOMES.db -n PANGENOMES | $ anvi-pan-genome -g ALL_GENOMES.db -n PANGENOMES | ||
- | -n 뒤에 기입하는 것은 PROJECT_NAME으로서 실제로는 이 이름의 디렉토리가 생긴다. 그 하위에 | + | -n 뒤에 기입하는 것은 PROJECT_NAME으로서 실제로는 이 이름의 디렉토리가 생긴다. 그 하위에 |
- | $ anvi-display-pan -p PROJECT_NAME/PROJECT_NAME-PAN.db -g MY-GENOMES.db | + | $ anvi-display-pan -p PANGENOMES/PANGENOMES-PAN.db -g ALL_GENOMES.db |
+ | Anvi's interactive interface에 대한 상세한 설명은 [[http:// | ||
| | ||
Average nucleotide identity(ANI) 분석도 실시할 수 있다. | Average nucleotide identity(ANI) 분석도 실시할 수 있다. | ||
Line 111: | Line 117: | ||
| | ||
| | ||
- | pyani 실행 단계에서 pandas가 없다는 메시지가 나온다. 거듭된 테스트 결과 그 이유를 알아냈다. 도커 이미지 내에서 파이썬 기준 버전은 2.7이다. 그러나 Anvi' | + | pyani 실행 단계에서 pandas가 없다는 메시지가 나온다. 거듭된 테스트 결과 그 이유를 알아냈다. 도커 이미지 내에서 파이썬 기준 버전은 2.7이다. 그러나 Anvi' |
- | ANI 분석 결과물의 시각화는 | + | ANI 분석 결과물의 시각화는 |
- | $ anvi-display-ani -g PROCHLORO-GENOMES.db \ | + | === External gene call 정보를 이용하기 ==== |
- | -p PROCHLORO/Prochlorococcus_Pan-PAN.db | + | |
- | 처음에는 | + | 윗부분 ' |
+ | |||
+ | === Layer란? === | ||
+ | [[http://merenlab.org/ | ||
+ | |||
+ | Anvi' | ||
+ | |||
+ | === Gene cluster 탐색하기 === | ||
+ | |||
+ | === 유전자 기능과 관련한 분석하기 === | ||
- | === Docker 안에서 패키지 설치하기 === | ||
- | 필요하다면 apt-get을 이용하여 필요한 패키지를 설치할 수 있다. 도커 이미지를 처음 적재한 뒤에는 apt-get update를 한번 해 주어야 패키지 설치가 가능하다. 필요한 파이썬 패키지가 있으면 pip3를 사용해야 한다. 기본 인터프리터가 비록 python 2.7이지만 이 이미지에는 pip3가 설치된 상태이고 모든 필요한 라이브러리 역시 이를 기준으로 설치된 상태이다. 도커 컨테이너를 변경하여 재사용하려면 docker commit 명령어를 알아야 한다. 자세한 방법은 [정해영의 블로그] [[http:// | ||
Line 157: | Line 170: | ||
anvi-run-ncbi-cogs -c $i --num-threads 20 | anvi-run-ncbi-cogs -c $i --num-threads 20 | ||
done | done | ||
- | COG data directory의 기본 위치는 / | + | COG data directory의 기본 위치는 / |
+ | |||
+ | ==== 기타 노하우 ==== | ||
+ | |||
+ | |||
+ | === Docker 안에서 패키지 설치하기 === | ||
+ | 필요하다면 apt-get을 이용하여 필요한 패키지를 설치할 수 있다. 도커 이미지를 처음 적재한 뒤에는 apt-get update를 한번 해 주어야 패키지 설치가 가능하다. 필요한 파이썬 패키지가 있으면 pip3를 사용해야 한다. 기본 인터프리터가 비록 python 2.7이지만 이 이미지에는 pip3가 설치된 상태이고 모든 필요한 라이브러리 역시 이를 기준으로 설치된 상태이다. 도커 컨테이너를 변경하여 재사용하려면 docker commit 명령어를 알아야 한다. 자세한 방법은 [정해영의 블로그] [[http:// |
bioinfo/anvio.1531204106.txt.gz · Last modified: (external edit)