User Tools

Site Tools


bioinfo:일루미나_데이터의_qc와_기본_전처리

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
bioinfo:일루미나_데이터의_qc와_기본_전처리 [2023/06/21 15:10] – [일반적인 서열 데이터 조작] hyjeongbioinfo:일루미나_데이터의_qc와_기본_전처리 [2025/01/03 13:53] (current) – [SSU rRNA 서열의 재구성] hyjeong
Line 45: Line 45:
   $ fastq-stats FILE.fastq # 표준 출력으로 sequence statistics 수치를 출력함   $ fastq-stats FILE.fastq # 표준 출력으로 sequence statistics 수치를 출력함
  
-===== SSU rRNA 서열의 재구성 ======+===== SSU rRNA(16S rRNA) 서열의 재구성 ======
 [[https://github.com/HRGV/phyloFlash|phyloFlash]]는 일루미나 데이터셋으로부터 SSU rRNA 서열을 재구성하여 동정하는 도구이다. Silva reference database에 대한 read mapping을 하여 해당되는 read를 회수한 뒤 targeted assembly를 거쳐 전장 SSU rRNA 서열을 만들어낸다. 원래는 메타게놈 혹은 메타트랜스크립톰 read의 분석을 위해 만들어진 것이지만 단일 유전체의 시퀀싱 read에 이를 적용하면 시퀀싱 라이브러리의 오염 여부를 점검할 수도 있다. 결과물은 단순 텍스트 및 HTML 형식의 리포트로 제공된다. 아래에 보인 실행 사례에서 모든 결과 파일은 LIB이라는 접두사를 갖는다. [[https://github.com/HRGV/phyloFlash|phyloFlash]]는 일루미나 데이터셋으로부터 SSU rRNA 서열을 재구성하여 동정하는 도구이다. Silva reference database에 대한 read mapping을 하여 해당되는 read를 회수한 뒤 targeted assembly를 거쳐 전장 SSU rRNA 서열을 만들어낸다. 원래는 메타게놈 혹은 메타트랜스크립톰 read의 분석을 위해 만들어진 것이지만 단일 유전체의 시퀀싱 read에 이를 적용하면 시퀀싱 라이브러리의 오염 여부를 점검할 수도 있다. 결과물은 단순 텍스트 및 HTML 형식의 리포트로 제공된다. 아래에 보인 실행 사례에서 모든 결과 파일은 LIB이라는 접두사를 갖는다.
 +
 +  $ phyloFlash.pl -lib LIB -read1 reads_F.fq.gz -read2 reads_R.fq.gz -CPUs 16
 +  $ phyloFlash.pl -lib LIB -CPUs 16 -read1 reads_FR.fq.gz # interleaved file
  
  
bioinfo/일루미나_데이터의_qc와_기본_전처리.1687327822.txt.gz · Last modified: 2023/06/21 15:10 by hyjeong