최근 CLC Genomics Workbench에서 새롭게 도입하여 발전시킨 개념은 바로 track과 metadata table 활용 기능이 아닐까 한다. Track은 대용량의 NGS data를 위한 시각화와 비교 및 분석을 용이하게 만드는 통일 프레임워크인데, 글로는 그 개념을 뚜렷이 드러나게 설명하기가 어렵다. 이 페이지에서 다룰 사항은 바로 메타데이터이다. 이는 '데이터를 기술하는 데이터'라고 간단하게 정의할 수 있다. 예를 들어 하나의 RNA-seq sequencing file이 얻어진 경우 이것이 유래한 샘플의 성격, 처리 정보, 샘플의 원천 등 다양한 부가 정보를 엑셀 파일이나 csv(comma-separated values) file로 작성할 수 있다. CLC Genomics Workbench에서는 임포트 기능을 이용하여 이미 만들어진 메타데이터 파일을 읽어들이거나, 혹은 직접 작성하는 것이 가능하다. 일단 메타데이터 테이블이 이렇게 만들어지면 데이터를 연결하여 그 안에서 후속 분석 작업을 할 수도 있다. 따라서 데이터 파일의 수가 많아지면 메타데이터를 만들어서 활용하는 것을 강력하게 추천한다.
메타데이터 테이블을 임포트하든 혹은 CLC 안에서 직접 만들든 가장 중요한 것은 실제의 데이터와 association하는 것이다. 이를 위해서는 이미 CLC로 임포트된 데이터 파일의 이름과 메타데이터 테이블의 특정 컬럼의 값들이 매치해야 된다. 다행히 100% 정확히 맞을 필요는 없고 부분적인 매치만 되어도 연결이 가능함을 알아두자.
메뉴 위치: File | Import | Import Metadata 매뉴얼 보기
메뉴 위치 File | New | Metadata Table 매뉴얼 보기
이 메뉴는 새로 테이블을 만드는 것 외에도 이미 불러들인 테이블을 편집하는 기능도 제공한다.