User Tools

Site Tools


transcriptome_analysis

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
transcriptome_analysis [2017/04/07 18:24] – [GenBank flat file] hyjeongtranscriptome_analysis [2021/03/17 13:09] (current) – external edit 127.0.0.1
Line 2: Line 2:
 RNA-seq을 이용한 진핵 생물의 전사체(transcriptome) 분석에서는 TopHat-Cufflioks-Cuffmerge-Cuffdiff-(CummeRbund)로 이어지는 [[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3334321/figure/F2/|Tuxedo protocol]]이 표준으로 여겨지고 있다. 여기에서는 splicing을 고려한 read alignment, 새로운 유전자의 발견, novel splice variant의 발견 등이 관건이 된다. Cufflinks version 2.2.0부터는 Cuffquant/Cuffnorm이라는 새로운 프로그램을 포함하는 워크플로우로 바뀌었다([[http://cole-trapnell-lab.github.io/cufflinks/releases/v2.2.0/|링크]]). RNA-seq을 이용한 진핵 생물의 전사체(transcriptome) 분석에서는 TopHat-Cufflioks-Cuffmerge-Cuffdiff-(CummeRbund)로 이어지는 [[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3334321/figure/F2/|Tuxedo protocol]]이 표준으로 여겨지고 있다. 여기에서는 splicing을 고려한 read alignment, 새로운 유전자의 발견, novel splice variant의 발견 등이 관건이 된다. Cufflinks version 2.2.0부터는 Cuffquant/Cuffnorm이라는 새로운 프로그램을 포함하는 워크플로우로 바뀌었다([[http://cole-trapnell-lab.github.io/cufflinks/releases/v2.2.0/|링크]]).
  
-그러나 이 방법을 박테리아 대상의 RNA-seq data analysis에 그대로 적용하는 것은 무리가 있다. 특히 read alignment 과정이 박테리아에게는 딱 맞지 않는다. 왜냐하면 유전자 밀도가 낮은 진핵 생물과 달리 원핵 생물은 유전자 배열이 매우 촘촘하여 심지어는 서로 겹치기도 하고, splicing이 일어나지 않기 때문이다. 따라서 일반적인 (genome 유래) read mapping program을 그대로 사용하여 reference genome sequence에 붙이는 것이 더 나을 수 있다. 이러한 전체적인 과정은 2016년 발표된 한 논문("SPARTA: Simple Program Automated reference-based bacterial RNA-seq Transcriptome Analysis)의 [[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4743240/figure/Fig1/|그림]]에 아주 잘 표현되어 있다. +그러나 이 방법을 박테리아 대상의 RNA-seq data analysis에 그대로 적용하는 것은 무리가 있다. 특히 read alignment 과정이 박테리아에게는 딱 맞지 않는다. 왜냐하면 유전자 밀도가 낮은 진핵 생물과 달리 원핵 생물은 유전자 배열이 매우 촘촘하여 심지어는 서로 겹치기도 하고, splicing이 일어나지 않기 때문이다. 따라서 일반적인 (genome 유래) read mapping program을 그대로 사용하여 reference genome sequence에 붙이는 것이 더 나을 수 있다. 뿐만 아니라 세균의 경우 워낙 그 종류가 많아서 일부 모델 세균을 제외하면 표준적인 reference(annotation 정보 포함)가 없는 경우가 대다수이다. 즉, 분석을 하려는 당사자가 reference 정보를 같이 
 + 준비해야 한다는 뜻이다. 이러한 전체적인 과정은 2016년 발표된 한 논문("SPARTA: Simple Program Automated reference-based bacterial RNA-seq Transcriptome Analysis)의 [[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4743240/figure/Fig1/|그림]]에 아주 잘 표현되어 있다. 
  
 아주 쉽게 이야기하자면 RNA-seq read의 mapping을 통해서 샘플로부터 다음 그림과 같은 형태의 데이터를 얻어내는 것이 첫번째 단계라고 할 수 있다. 각 셀을 채우는 수치는 특정 샘플(조건 및 반복)의 유전자가 갖는 expression value이다. 이것은 read count일 수도 있고, RPKM/FPKM 및 이에 상응하는 값일 수도 있다.  아주 쉽게 이야기하자면 RNA-seq read의 mapping을 통해서 샘플로부터 다음 그림과 같은 형태의 데이터를 얻어내는 것이 첫번째 단계라고 할 수 있다. 각 셀을 채우는 수치는 특정 샘플(조건 및 반복)의 유전자가 갖는 expression value이다. 이것은 read count일 수도 있고, RPKM/FPKM 및 이에 상응하는 값일 수도 있다. 
transcriptome_analysis.1491557051.txt.gz · Last modified: (external edit)