User Tools

Site Tools


reference_mapping_및_variant_calling

This is an old revision of the document!


Reference mapping 및 variant calling

개요

  • Reference로는 E. coli B str. REL606의 유전체 서열을 NCBI에서 다운로드하여 사용한다.
  • Short read mapper로는 bowtie2 사용(PATH 환경변수에 설정)
  • samtools, bctools 및 vcfutils.pl(링크)는 편의상 A5-miseq에 포함된 것을 사용하고, 역시 PATH 환경변수에 포함시킨다.
$ export PATH=$PATH:/usr/local/Bio/bowtie2-2.2.6
$ export PATH=$PATH:/usr/local/Bio/a5_miseq_linux_20140604/bin

1. Bowtie2를 이용한 mapping

Reference sequence의 다운로드 및 인덱스 생성

$ wget ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA_000017985.1_ASM1798v1/GCA_000017985.1_ASM1798v1_genomic.fna.gz
$ gzip -d GCA_000017985.1_ASM1798v1_genomic.fna.gz
$ mkdir bowtie2 (반드시 별도의 디렉토리를 만들지 않아도 됨)
$ bowtie2-build GCA_000017985.1_ASM1798v1_genomic.fna bowtie2/REL606

Mapping

$ bowtie2 -x bowtie2/REL606 -1 BL21-20x_1.fastq -2 BL21-20x_2.fastq -S BL21.sam
$ samtools view -b -S -o BL21.bam BL21.sam

(optional) Read alignment의 시각화

  • IGVtablet을 사용하여 assembly 및 alignment의 시각화 가능
  • [IGV] Genomes → Create .genome File에서 fasta file을 로드한 다음 File → Load from file에서 sorting 및 indexing이 완료된 bam file을 로드

(optional) Mapping 관련 수치의 출력

2. Variant calling

[1] 일반적인 과정

[2] Pipe를 사용한 간략화

참고자료

reference_mapping_및_variant_calling.1455586014.txt.gz · Last modified: (external edit)