Table of Contents

CMG-biotools 기능 실습

개요

VirtualBox 환경에서 CMG-biotools 가상머신을 켠 후 바탕화면에서 마우스 오른쪽 버튼을 클릭하여('Open Terminal Here') 터미널창을 띄운 뒤 다음에 소개하는 명령어를 입력하여 실습을 진행한다. CMG-biotools의 명령어(스크립트)들은 /usr/biotools에 있으니 필요하다면 다른 리눅스 시스템에 복사하여 사용해도 된다.

GenBanke에서 파일 받기

$ gbk_get -a CP001509 > file.gbk

GenBank file에서 organism name 추출하기

$ gbk_ExtractName file.gbk (organism name을 파일명으로 하는 새로운 GenBank file 생성)

GenBank file에서 염기서열 출력하기

$ saco_convert –I genbank –O fasta file.gbk > file.fa

GenBank file에서 유전자(nt)/아미노산 서열 출력하기

$ gbk_ExtractGeneProt file.gbk (.fna, .fsa 생성)

Prodigal을 이용한 유전자 예측하기

$ prodigalrunner file.fa (.gff, .gbk, .fna, .fsa 생성)

Genome 기본 특성 구하기(크기, %GC 등의 정보를 화면으로 출력)

$ stats_genomeDNA file.fa

Genome atlast 그리기

$ atlas_createConfig –ref file.gbk
$ atlas –f file.gbk –c file.gbk.atlas.cf –o file.gbk.atlas.ps
$ evince file.gbk.atlas.ps

rRNA gene 찾기

$ rnamer –S bac –m ssu –f file.rrna file.fa (ssu for 5/8S, lsu 23/28S)

5종의 대장균 유전체 서열을 이용한 BLAST atlas 그리기(가상머신에서는 장시간 소요)

$ gbk_get -a NC_000913 > K-12.gbk
$ gbk_get -a CP001509 > BL21_DE3.gbk
$ gbk_get -a NC_002695 > O157_H7.gbk
$ gbk_get -a NC_011750 > IAI39.gbk
$ gbk_get NC_017634 > O83_H1.gbk
$ fox x in *gbk
> do
> gbk_ExtractGeneProt $x
> done
$ atlas_createConfig -ref K-12.gbk (K-12를 reference로 설정)
$ atlas_addBlastlane -f K-12.gbk.fsa -c K-12.gbk.atlas.cf -col 000090 -name K-12 (.cf 파일에 blast lane 추가)
$ atlas_addBlastlane -f BL21_DE3.fsa -c K-12.gbk.atlas.cf -col 009000 -name BL21_DE3
$ atlas_addBlastlane -f IAI38.gbk.fsa -c K-12.gbk.atlas.cf -col 900000 -name IAI38
$ atlas_addBlastlane -f O157_H7.gbk.fsa -c K-12.gbk.atlas.cf -col 000050 -name O157_H7
$ atlas_addBlastlane -f O83_H1.gbk.fsa -c K-12.gbk.atlas.cf -col 005000 -name O83_H1
$ atlas -f K-12.gbk -c K-12.gbk.atlas.cf -o K-12.gbk.blastatlas.ps
$ evince K-12.gbk.blastatlas.ps

BLAST matrix 그리기(가상머신에서는 장시간 소요)

$ mkdir blastmatrix
$ cp *fsa blastmatrix
$ cd blastmatrix
$ matrix_createConfig > matrix.xml (표시되는 텍스트를 바꾸려면 .xml을 수정)
$ matrix -cpu 5 matrix.xml > blastmatrix.ps
$ evince blastmatrix.ps

참고자료

리눅스 가상머신 환경에서 일루미나 read를 이용한 de novo assembly부터 genome annotation까지를 실행할 수 있는 MyPro가 최근 발표되었다. 이 시스템에서는 복수의 de novo assembler를 실행하여 얻은 결과를 CISA contig integrator로 통합하여 최적의 결과를 만들어내는 것이 특징이다. 리눅스만을 할당하여 돌릴 하드웨어가 마련되지 않은 상황이라면, 이러한 가상머신을 적극적으로 활용하는 것도 좋은 대안이 될 것이다. MyPro의 활용에 관란 문서는 여기를 참조하라.

Bio-Linux 기능 실습

설정

일반

클립보드 공유를 '양방향'으로 세팅한다(설정→일반→고급)

공유 폴더

게스트 확장을 먼저 설치해야 한다. 자동 마운트를 설정하였으므로 이미 /media/sf_vbox에 마운트된 상태이다. CMG-biotools와는 무엇이 다른지 알아보라.

manager@bl8vbox[manager] df                                           [ 8:41AM]
Filesystem     1K-blocks      Used Available Use% Mounted on
/dev/sda1       98595436   9176352  84387612  10% /
none                   4         0         4   0% /sys/fs/cgroup
udev             1014168         4   1014164   1% /dev
tmpfs             204992       816    204176   1% /run
none                5120         0      5120   0% /run/lock
none             1024956        76   1024880   1% /run/shm
none              102400        52    102348   1% /run/user
vbox           488283156 247657740 240625416  51% /media/sf_vbox