====== CLC Genomics Workbench를 이용한 전사체 분석 ====== ===== 관련 자료 링크 ===== * [[https://www.qiagenbioinformatics.com/support/manuals/|User manual]](온라인 매뉴얼 및 PDF 매뉴얼) * [[https://www.qiagenbioinformatics.com/support/tutorials/|튜토리얼 보관소]]: Expression analysis 섹션 참고 - [[http://resources.qiagenbioinformatics.com/tutorials/Expression_analysis.pdf|Microarray-basd expression analysis]]([[http://resources.qiagenbioinformatics.com/testdata/RNA_Seq_Droso2.zip|샘플 데이터]]): RNA-seq에도 적용 가능하다. - [[http://resources.qiagenbioinformatics.com/tutorials/RNASeq-droso.pdf|Expression analysis using RNA-Seq data]] Advanced RNA-Seq 무료 플러그인을 설치해야 한다. * 박테리아를 위한 transcriptome analysis(내부문서)는 [[../transcriptome_analysis|여기]]를 참조할 것 ===== 개요 ===== 2017년 10월판(v10.1.1)을 기준으로 유전자 발현 분석 기능은 Toolbox의 **RNA-Seq Analysis**(Advanced RNA-Seq 무료 플러그인 설치 필요)와 **Microarray and Small RNA Analysis**에 위치한다. 과거에는 Toolbox의 Transcriptomics Analysis라는 폴더 내에 RNA-Seq Analysis 기능이 있었다. {{:bioinfo:제목_없음.png|}} CLC에서는 raw RNA-seq file로부터 매핑, QC, 발현 분석과 plotting을 하는 것 외에도 csv 파일로 이루어진 expression data를 임포트하여 분석하는 것도 가능하다. 요즘 권장되는 것은 메타데이터 파일을 만들어서 여기에 종속된 데이터 파일(및 중간 결과물 파일)을 간적 간접적으로 다루는 것이다. ==== Metadata file 만들기 ==== 메타데이터 파일은 외부에서 엑셀로 만든 것을 임포트해도 되고, 정보량이 많지 않다면 File -> New -> Metadata Table에서 직접 작성해도 무방하다. 여기에서는 후자, 즉 Metadata Table Editor에서 직접 표를 만드는 것을 전제로 설명한다. CLC의 샘플 데이터 파일에서 추출한 메타데이터 파일은 {{ :bioinfo:drosophilametadata.xlsx |여기}}를 참조하라. 메타데이터 테이블은 Microbial Genomics Module의 기능을 활용하는 데에도 중요하게 쓰이므로 작성 및 편집 방법을 숙지해 두면 큰 도움이 될 것이다. - 'Set Uo Table...' 버튼을 클릭한다. 컬럼을 하나씩 추가하면서 이름과 설명을 붙인다. 즉 테이블의 기본 구조를 짜는 것이다. 어느 하나는 Key column으로 지정한다. 기존의 파일을 읽어들여서 구조를 짜는 것도 가능하다(Set Up Structure from File...). - 'Manage Data..' 버튼을 클릭한다. 여기에서는 데이터를 row 형태로 추가하는 것이다. - 만들어진 테이블을 저장한다. - 테이블의 모든 row를 선택한다. - 'Associate Data...'를 클릭한 뒤 'Associate Data Automatically'를 클릭한다. - Data element를 선택한다. - Matching scheme을 Exact와 Partial 중 선택한다. Partial을 선택해도 대소문자는 구별되니 유의하라. - 마지막으로 'Find Associate Data'를 클릭한다.