bioinfo:참조_서열에_대한_매핑_reference_mapping_및_시각화
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:참조_서열에_대한_매핑_reference_mapping_및_시각화 [2023/06/21 15:00] – [SRA data를 다운로드하는 방법(상세)] hyjeong | bioinfo:참조_서열에_대한_매핑_reference_mapping_및_시각화 [2024/07/05 10:04] (current) – [Mapping의 실제] hyjeong | ||
---|---|---|---|
Line 6: | Line 6: | ||
===== Mapping의 실제 ===== | ===== Mapping의 실제 ===== | ||
- | 샘플로 사용할 Illumina sequencing read는 [[https:// | + | 샘플로 사용할 Illumina sequencing read는 |
# 실습용 raw data의 설명은 https:// | # 실습용 raw data의 설명은 https:// | ||
Line 26: | Line 26: | ||
$ samtools view -b -S -o BL21.bam BL21.sam | $ samtools view -b -S -o BL21.bam BL21.sam | ||
| | ||
- | SAM 파일의 대부분을 구성하는 read alignment 필드에서 두 번째 필드(flag, | + | SAM 파일의 대부분을 구성하는 read alignment 필드에서 두 번째 필드(flag, |
$ samtools flagstat BL21.bam | $ samtools flagstat BL21.bam | ||
Line 163: | Line 163: | ||
본 장의 시작 부분에서 fastq-dump를 이용한 SRA data 다운로드 방법을 간략하게 설명하였다. 만약 SRA와 연계된 메타데이터 파일이 필요하거나 웹브라우저 환경의 Run Selector를 이용해야 하는 경우, 또는 아마존 웹 서비스(Amazon Web Service, AWS)를 통한 다운로드가 필요하다면 NCBI의 공식 문서인 [[https:// | 본 장의 시작 부분에서 fastq-dump를 이용한 SRA data 다운로드 방법을 간략하게 설명하였다. 만약 SRA와 연계된 메타데이터 파일이 필요하거나 웹브라우저 환경의 Run Selector를 이용해야 하는 경우, 또는 아마존 웹 서비스(Amazon Web Service, AWS)를 통한 다운로드가 필요하다면 NCBI의 공식 문서인 [[https:// | ||
- | Single run에 대한 데이터를 열람하여 다운로드하려면 우선 [[https:// | + | Single run에 대한 데이터를 열람하여 다운로드하려면 우선 [[https:// |
+ | |||
+ | 복수의 SRA Experiment(예: | ||
+ | |||
+ | $ PATH=/ | ||
+ | $ parallel -j 1 prefetch {} ::: $(cat SRR_Acc_List.txt) | ||
+ | $ parallel -j 1 fastq-dump --skip-technical -F --split-files -O fastq {} ::: $(cat SRR_Acc_List.txt) | ||
+ | |||
+ | SRA의 Run Browser에서 Data access 탭을 선택한 다음 URL을 클릭하여 직접 다운로드를 할 수도 있다. 아래 그림처럼 NCBI Location 오른쪽의 [[https:// | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | 이를 ~/ | ||
+ | |||
+ | $ fastq-dump --split-files SRR8981517 | ||
+ | Read 1431064 spots for SRR8981517 | ||
+ | Written 1431064 spots for SRR8981517 | ||
+ | |||
+ | 사실은 앞서 설명했듯이 ‘fastq-dump %%--%%split-files SRR8981517’라고만 입력하여 실행을 해도 .sra 파일 다운로드와 fastq 추출 작업이 자동으로 연이어서 진행된다. | ||
+ | |||
===== 참고 자료 ===== | ===== 참고 자료 ===== | ||
[[https:// | [[https:// |
bioinfo/참조_서열에_대한_매핑_reference_mapping_및_시각화.1687327242.txt.gz · Last modified: by hyjeong