User Tools

Site Tools


metamos_test_2017

This is an old revision of the document!


MetAMOS test 2017

많은 어려움을 뚫고서 2016년 초여름에 MetAMOS를 설치하여 어느 상태로는 돌아가게 만드는데 성공하였다. 그러나 인쇄한 매뉴얼이 너덜너덜해지도록 줄을 치고 메모해가면서 정독하고 테스트를 하였지만 아직 완벽한 상태는 아니다. 만 1년이 되기 전에 사용법을 완전히 익히고 어느 리눅스 서버에든 쉽게 재설치를 할 수 있도록 다시 한 번 종합적인 테스트를 실시한다.

Candidatus Carsonella ruddii 샘플을 이용한 테스트

MetAMOS의 샘플 데이터는 160 kb의 작은 유전체를 지닌 bacterial endosymbiont “Candidatus Carsonella ruddii PV”의 50x read를 사용하는 것으로 되어있다. fasta 및 fastq 파일과 reference(complete)가 전부 존재한다.

8000000 bp / 100000 seqs; 80.0 average length -- carsonella_pe_filt.fna
8000000 bp / 100000 seqs; 80.0 average length -- carsonella_pe_filt.fq
159662 bp / 1 seqs; 159662.0 average length -- carsonella_reference.fna

실행 위치는 전부 path/to/metAMOS-1.53rc/Test 디렉토리이다.

initPipeline

interleaved fasta file의 사례이다.

../initPipeline -f -m carsonella_pe_filt.fna -d test1  -i 500:3500

runPipeline의 이해

-f STRING(force this step)과 -n STRING(step to skip)을 지정하지 않으면 MultiAlign, FunctionalAnnotation, FindRepeats, FindScaffoldORFS 단계를 생략한다. 실제로 사용된 명령어 라인은 output_directory/Logs/COMMANDS.log를 열어보면 그대로 나온다.

run_pipeline_test.sh의 실패 원인은?

MetAMOS 설치 뒤 가장 먼저 실행하는 run_pipeline_test.sh 스크립트는 FindScaffoldORFs 스텝에서 에러가 발생한다.

#/bin/sh
../initPipeline -f -m carsonella_pe_filt.fna -d test1  -i 500:3500
../runPipeline -a soap -c kraken -g fraggenescan -p 15 -d test1 -k 55 -f Assemble,MapReads,FindORFS,Annotate,FunctionalAnnotation,Propagate,Classify,Abundance,FindScaffoldORFS -n FunctionalAnnotation

FindScaffoldORFs 스텝이 이 스크립트에서는 반드시 실시하는 것으로 되어있지만 실제로는 필수가 아니다. 매뉴얼을 살펴보면 이 단게의 목적은 “Find ORFs in scaffolds, mainly serves as an extra validation step after Scaffold”라 설명하였다. 이 에러를 피하려면 다음의 두 가지 방법이 있다.

  1. FindScaffoldORFs를 생략한다. runPipeline에서 -f 이하 목록에서 이를 제거한다. 필수 스텝이 아니므로
  2. FindScaffoldORFs를 그대로 실행하되 기본 프로그램인 FragGeneScan을 MetaGeneMark로 바꾼다(-g metagenemark)
metamos_test_2017.1490229046.txt.gz · Last modified: (external edit)