metagenomic_data_assembly_pipeline
This is an old revision of the document!
Table of Contents
Metagenomic data assembly pipeline
metaWRAP
설치하기
- 설치 환경: ryzen-5950x server(32 threads, 128G memory)
- 설치 시작일: 2022년 7월 76일
mamba로 metaWRAP dependency를 설치하는 막바지 단계에서 QUAST가 요구하는 몇 개의 것을 수동으로 설치해야 한다.
The default QUAST package does not include: * GRIDSS (needed for structural variants detection) * SILVA 16S rRNA database (needed for reference genome detection in metagenomic datasets) * BUSCO tools and databases (needed for searching BUSCO genes) -- works in Linux only! To be able to use those, please run quast-download-gridss quast-download-silva quast-download-busco
마지막 명령어 세 줄을 실행하면서 에러를 만나게 될 것이다. 해결 방안은 잘 알고 있지? 대부분 SSL 인증서와 관련한 파일 다운로드 문제이다. metawrap-env를 나가서 개별 파일을 받는 것이 오히려 더 성공적일 때도 있다.
Database configuration
KRAKEN 2 Standard DB 설치 오류
KRAKEN 2 GitHub repository에서 반드시 최신 버전의 소스를 다운로드한다. 그러나 rsync_from_ncbi.pl: unexpected FTP path (new server?) 오류가 뜰 것이다. Kraken2 wiki의 FAQ에도 나올 정도로 유명한 문제이지만 여기에 나온대로 하면 해결이 되지 않았다. 다음의 두 사이트를 참고하여 관련 스크립트를 수정하니 겨우 유전체 파일 다운로드가 잘 되었다.
- https://bytemeta.vip/repo/DerrickWood/kraken2/issues/525 맨 아래 aeu79의 글을 따라서 하여라.
Anvi'o (An open-source, community-driven analysis and visualization platform for microbial 'omics)
metagenomic_data_assembly_pipeline.1657167609.txt.gz · Last modified: by hyjeong