cmg-biotools의_활용
Table of Contents
CMG-biotools 기능 실습
개요
VirtualBox 환경에서 CMG-biotools 가상머신을 켠 후 바탕화면에서 마우스 오른쪽 버튼을 클릭하여('Open Terminal Here') 터미널창을 띄운 뒤 다음에 소개하는 명령어를 입력하여 실습을 진행한다. CMG-biotools의 명령어(스크립트)들은 /usr/biotools에 있으니 필요하다면 다른 리눅스 시스템에 복사하여 사용해도 된다.
GenBanke에서 파일 받기
$ gbk_get -a CP001509 > file.gbk
GenBank file에서 organism name 추출하기
$ gbk_ExtractName file.gbk (organism name을 파일명으로 하는 새로운 GenBank file 생성)
GenBank file에서 염기서열 출력하기
$ saco_convert –I genbank –O fasta file.gbk > file.fa
GenBank file에서 유전자(nt)/아미노산 서열 출력하기
$ gbk_ExtractGeneProt file.gbk (.fna, .fsa 생성)
Prodigal을 이용한 유전자 예측하기
$ prodigalrunner file.fa (.gff, .gbk, .fna, .fsa 생성)
Genome 기본 특성 구하기(크기, %GC 등의 정보를 화면으로 출력)
$ stats_genomeDNA file.fa
Genome atlast 그리기
$ atlas_createConfig –ref file.gbk $ atlas –f file.gbk –c file.gbk.atlas.cf –o file.gbk.atlas.ps $ evince file.gbk.atlas.ps
rRNA gene 찾기
$ rnamer –S bac –m ssu –f file.rrna file.fa (ssu for 5/8S, lsu 23/28S)
5종의 대장균 유전체 서열을 이용한 BLAST atlas 그리기(가상머신에서는 장시간 소요)
$ gbk_get -a NC_000913 > K-12.gbk $ gbk_get -a CP001509 > BL21_DE3.gbk $ gbk_get -a NC_002695 > O157_H7.gbk $ gbk_get -a NC_011750 > IAI39.gbk $ gbk_get NC_017634 > O83_H1.gbk $ fox x in *gbk > do > gbk_ExtractGeneProt $x > done $ atlas_createConfig -ref K-12.gbk (K-12를 reference로 설정) $ atlas_addBlastlane -f K-12.gbk.fsa -c K-12.gbk.atlas.cf -col 000090 -name K-12 (.cf 파일에 blast lane 추가) $ atlas_addBlastlane -f BL21_DE3.fsa -c K-12.gbk.atlas.cf -col 009000 -name BL21_DE3 $ atlas_addBlastlane -f IAI38.gbk.fsa -c K-12.gbk.atlas.cf -col 900000 -name IAI38 $ atlas_addBlastlane -f O157_H7.gbk.fsa -c K-12.gbk.atlas.cf -col 000050 -name O157_H7 $ atlas_addBlastlane -f O83_H1.gbk.fsa -c K-12.gbk.atlas.cf -col 005000 -name O83_H1 $ atlas -f K-12.gbk -c K-12.gbk.atlas.cf -o K-12.gbk.blastatlas.ps $ evince K-12.gbk.blastatlas.ps
BLAST matrix 그리기(가상머신에서는 장시간 소요)
$ mkdir blastmatrix $ cp *fsa blastmatrix $ cd blastmatrix $ matrix_createConfig > matrix.xml (표시되는 텍스트를 바꾸려면 .xml을 수정) $ matrix -cpu 5 matrix.xml > blastmatrix.ps $ evince blastmatrix.ps
참고자료
리눅스 가상머신 환경에서 일루미나 read를 이용한 de novo assembly부터 genome annotation까지를 실행할 수 있는 MyPro가 최근 발표되었다. 이 시스템에서는 복수의 de novo assembler를 실행하여 얻은 결과를 CISA contig integrator로 통합하여 최적의 결과를 만들어내는 것이 특징이다. 리눅스만을 할당하여 돌릴 하드웨어가 마련되지 않은 상황이라면, 이러한 가상머신을 적극적으로 활용하는 것도 좋은 대안이 될 것이다. MyPro의 활용에 관란 문서는 여기를 참조하라.
Bio-Linux 기능 실습
- 웹사이트: http://environmentalomics.org/bio-linux/ (latest: version 8, released July 2014)
- 설치 방법: http://environmentalomics.org/bio-linux-installation/ (.ova file로 설치하는 경우 ID와 password는 전부 manager이다)
설정
일반
클립보드 공유를 '양방향'으로 세팅한다(설정→일반→고급)
공유 폴더
게스트 확장을 먼저 설치해야 한다. 자동 마운트를 설정하였으므로 이미 /media/sf_vbox에 마운트된 상태이다. CMG-biotools와는 무엇이 다른지 알아보라.
manager@bl8vbox[manager] df [ 8:41AM] Filesystem 1K-blocks Used Available Use% Mounted on /dev/sda1 98595436 9176352 84387612 10% / none 4 0 4 0% /sys/fs/cgroup udev 1014168 4 1014164 1% /dev tmpfs 204992 816 204176 1% /run none 5120 0 5120 0% /run/lock none 1024956 76 1024880 1% /run/shm none 102400 52 102348 1% /run/user vbox 488283156 247657740 240625416 51% /media/sf_vbox
cmg-biotools의_활용.txt · Last modified: 2021/03/17 13:09 by 127.0.0.1