bioinfo:batch_download_of_ncbi_genomes
This is an old revision of the document!
NCBI에서 특정 분류군에 속하는 미생물 유전체를 일괄적으로 다운로드하기
페이지네임을 한글로 길게 만들었더니 저장이 되지 않는 현상을 발견하였다. DoluWiki의 문제인 듯.
NCBI에서 제공하는 공식 문서 Genome Download (FTP) FAQ에 유용한 정보가 많으므로 이것을 일단 숙독하는 것이 좋을 것이다.
다운로드 전용 유틸리티를 사용하는 방법
간단한 방법으로는 ncbi-genome-download가 편리하다. 개별적인 assembly accession은 물론 사용자가 정의한 유전체의 그룹 단위로 다운로드할 수 있어 매우 유용하다. 맨 마지막 옵션으로는 bacteria, archaea, fungi, viral과 같은 group 정보를 반드시 주어야 한다. 이 스크립트는 실행할 때 날짜 기준으로 $HOME/.cache/ncbi-genome-download에 assembly summary file의 캐시를 생성한다. –no-cache 옵션을 사용하면 이를 무시할 수 있다. '–assembly-accession'('-A'와 동일) 파라미터는 단일 accession, 쉼표로 구분한 accession, 또는 파일 형태로 수록한 accession을 전부 받아들일 수 있어 매우 유용하다. 단지 종 및 균주 명칭만을 입수하기 위함이라면 뒤에서 소개할 NCBI EDirect 명령어 조합(esearch | efetch | xtract)보다 훨씬 빠르다.
bioinfo/batch_download_of_ncbi_genomes.1687408634.txt.gz · Last modified: 2023/06/22 13:37 by hyjeong