custom_kraken_db_test
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
custom_kraken_db_test [2016/12/13 21:34] – [Standard Kraken database] hyjeong | custom_kraken_db_test [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 4: | Line 4: | ||
==== Standard Kraken database ==== | ==== Standard Kraken database ==== | ||
- | Kraken DB를 만들려면 taxonomy 정보가 포함된 서열 자료(fasta files)와 NCBI taxonomy 파일이 필요하다. Standard | + | Kraken DB를 만들려면 taxonomy 정보가 포함된 서열 자료(fasta files)와 NCBI taxonomy 파일이 필요하다. |
> | > | ||
- | 단, 이제는 NCBI에서 bacteria 유전체 서열 전부를 압축한 all.fna.tar.gz를 더 이상 업데이트하지 않고 있으며 보관 위치도 변경되었다. 따라서 Kraken package의 download_genomic_library.sh를 다음과 같이 일부 수정해야 한다. 다행스럽게도 virus에 대해서는 아직 변경되지 않은 위치에서 all.fna.tar.gz를 제공한다. | + | 단, 이제는 NCBI에서 bacteria 유전체 서열 전부를 압축한 all.fna.tar.gz를 더 이상 업데이트하지 않고 있으며 보관 위치도 변경되었다. 따라서 Kraken package의 download_genomic_library.sh를 다음과 같이 일부 수정해야 한다. 다행스럽게도 virus에 대해서는 아직 변경되지 않은 위치에서 all.fna.tar.gz를 제공한다. bacteria 라이브러리는 2786건의 유전체(업데이트되지 않음), 그리고 viruses 라이브러리는 2017년 3월 28일 현재 4391 건의 유전체가 존재한다. plamids library는 download_genomic_library.sh에 따르면 $FTP_SERVER/ |
+ | FTP_SERVER=" | ||
(수정 전) wget $FTP_SERVER/ | (수정 전) wget $FTP_SERVER/ | ||
(수정 후) wget $FTP_SERVER/ | (수정 후) wget $FTP_SERVER/ | ||
Line 15: | Line 16: | ||
**현재의 [[https:// | **현재의 [[https:// | ||
- | Bacteria/ | + | Bacteria/ |
- | $ mkdir kraken-standard | ||
$ PATH=/ | $ PATH=/ | ||
$ ./ | $ ./ | ||
Line 57: | Line 57: | ||
{{ : | {{ : | ||
+ | |||
+ | ==== GI number의 퇴출 문제 ==== | ||
+ | 2016년 9월을 기하여 NCBI가 제공하는 GenBank, GenPept 및 FASTA 포맷에서는 더 이상 GI 번호를 쓰지 않게 되었다([[https:// | ||
| | ||
===== Kraken 실행 방법 ===== | ===== Kraken 실행 방법 ===== |
custom_kraken_db_test.1481632463.txt.gz · Last modified: 2021/03/17 13:09 (external edit)