====== CMG-biotools 기능 실습 ====== ===== 개요 ===== VirtualBox 환경에서 [[http://www.cbs.dtu.dk/biotools/CMGtools/|CMG-biotools]] 가상머신을 켠 후 바탕화면에서 마우스 오른쪽 버튼을 클릭하여('Open Terminal Here') 터미널창을 띄운 뒤 다음에 소개하는 명령어를 입력하여 실습을 진행한다. CMG-biotools의 명령어(스크립트)들은 /usr/biotools에 있으니 필요하다면 다른 리눅스 시스템에 복사하여 사용해도 된다. ===== GenBanke에서 파일 받기 ===== $ gbk_get -a CP001509 > file.gbk ===== GenBank file에서 organism name 추출하기 ===== $ gbk_ExtractName file.gbk (organism name을 파일명으로 하는 새로운 GenBank file 생성) ===== GenBank file에서 염기서열 출력하기 ===== $ saco_convert –I genbank –O fasta file.gbk > file.fa ===== GenBank file에서 유전자(nt)/아미노산 서열 출력하기 ===== $ gbk_ExtractGeneProt file.gbk (.fna, .fsa 생성) ===== Prodigal을 이용한 유전자 예측하기 ===== $ prodigalrunner file.fa (.gff, .gbk, .fna, .fsa 생성) ===== Genome 기본 특성 구하기(크기, %GC 등의 정보를 화면으로 출력) ===== $ stats_genomeDNA file.fa ===== Genome atlast 그리기 ===== $ atlas_createConfig –ref file.gbk $ atlas –f file.gbk –c file.gbk.atlas.cf –o file.gbk.atlas.ps $ evince file.gbk.atlas.ps ===== rRNA gene 찾기 ===== $ rnamer –S bac –m ssu –f file.rrna file.fa (ssu for 5/8S, lsu 23/28S) ===== 5종의 대장균 유전체 서열을 이용한 BLAST atlas 그리기(가상머신에서는 장시간 소요) ===== $ gbk_get -a NC_000913 > K-12.gbk $ gbk_get -a CP001509 > BL21_DE3.gbk $ gbk_get -a NC_002695 > O157_H7.gbk $ gbk_get -a NC_011750 > IAI39.gbk $ gbk_get NC_017634 > O83_H1.gbk $ fox x in *gbk > do > gbk_ExtractGeneProt $x > done $ atlas_createConfig -ref K-12.gbk (K-12를 reference로 설정) $ atlas_addBlastlane -f K-12.gbk.fsa -c K-12.gbk.atlas.cf -col 000090 -name K-12 (.cf 파일에 blast lane 추가) $ atlas_addBlastlane -f BL21_DE3.fsa -c K-12.gbk.atlas.cf -col 009000 -name BL21_DE3 $ atlas_addBlastlane -f IAI38.gbk.fsa -c K-12.gbk.atlas.cf -col 900000 -name IAI38 $ atlas_addBlastlane -f O157_H7.gbk.fsa -c K-12.gbk.atlas.cf -col 000050 -name O157_H7 $ atlas_addBlastlane -f O83_H1.gbk.fsa -c K-12.gbk.atlas.cf -col 005000 -name O83_H1 $ atlas -f K-12.gbk -c K-12.gbk.atlas.cf -o K-12.gbk.blastatlas.ps $ evince K-12.gbk.blastatlas.ps ===== BLAST matrix 그리기(가상머신에서는 장시간 소요) ===== $ mkdir blastmatrix $ cp *fsa blastmatrix $ cd blastmatrix $ matrix_createConfig > matrix.xml (표시되는 텍스트를 바꾸려면 .xml을 수정) $ matrix -cpu 5 matrix.xml > blastmatrix.ps $ evince blastmatrix.ps ===== 참고자료 ===== 리눅스 가상머신 환경에서 일루미나 read를 이용한 de novo assembly부터 genome annotation까지를 실행할 수 있는 [[http://www.sciencedirect.com/science/article/pii/S0167701215001207|MyPro]]가 최근 발표되었다. 이 시스템에서는 복수의 de novo assembler를 실행하여 얻은 결과를 [[http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0060843|CISA contig integrator]]로 통합하여 최적의 결과를 만들어내는 것이 특징이다. 리눅스만을 할당하여 돌릴 하드웨어가 마련되지 않은 상황이라면, 이러한 가상머신을 적극적으로 활용하는 것도 좋은 대안이 될 것이다. MyPro의 활용에 관란 문서는 [[MyPro 활용하기|여기]]를 참조하라. ====== Bio-Linux 기능 실습 ====== * 웹사이트: http://environmentalomics.org/bio-linux/ (latest: version 8, released July 2014) * 설치 방법: http://environmentalomics.org/bio-linux-installation/ (.ova file로 설치하는 경우 ID와 password는 전부 manager이다) ===== 설정 ===== ==== 일반 ==== 클립보드 공유를 '양방향'으로 세팅한다(설정->일반->고급) ==== 공유 폴더 ==== 게스트 확장을 먼저 설치해야 한다. {{ :공유폴더_bio-linux.png?400 |}} 자동 마운트를 설정하였으므로 이미 /media/sf_vbox에 마운트된 상태이다. CMG-biotools와는 무엇이 다른지 알아보라. manager@bl8vbox[manager] df [ 8:41AM] Filesystem 1K-blocks Used Available Use% Mounted on /dev/sda1 98595436 9176352 84387612 10% / none 4 0 4 0% /sys/fs/cgroup udev 1014168 4 1014164 1% /dev tmpfs 204992 816 204176 1% /run none 5120 0 5120 0% /run/lock none 1024956 76 1024880 1% /run/shm none 102400 52 102348 1% /run/user vbox 488283156 247657740 240625416 51% /media/sf_vbox