User Tools

Site Tools


sars-cov-2_검출을_위한_pcr_프라이머_설계

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
sars-cov-2_검출을_위한_pcr_프라이머_설계 [2021/12/03 16:36] – [실제 방법] hyjeongsars-cov-2_검출을_위한_pcr_프라이머_설계 [2023/06/28 15:07] (current) – [들어가는 글] hyjeong
Line 1: Line 1:
 ====== SARS-CoV-2 검출을 위한 PCR 프라이머 설계 ====== ====== SARS-CoV-2 검출을 위한 PCR 프라이머 설계 ======
-<color #22b14c>아직 위키문서 작성이 끝나지 않았습니다!  --- //[[hyjeong@kribb.re.kr|Haeyoung Jeong]] 2021/12/02 08:50//</color> 제 블로그에 별도의 글인 [[https://blog.genoglobe.com/2021/12/pcr.html|감염병 진단용 PCR 프라이머 설계 그리고 결과물의 평가]]를 게시하였습니다.+  * Unordered List Item<color #22b14c>아직 위키문서 작성이 끝나지 않았습니다!  --- //[[hyjeong@kribb.re.kr|Haeyoung Jeong]] 2021/12/02 08:50//</color>  
 +  * 제 블로그에 별도의 글인 [[https://blog.genoglobe.com/2021/12/pcr.html|감염병 진단용 PCR 프라이머 설계 그리고 결과물의 평가]]를 게시하였습니다. 
 +  * Genes & Genomics에 제 논문이 게재되었습니다. [[https://link.springer.com/article/10.1007/s13258-022-01264-7|Identification of conserved regions from 230,163 SARS-CoV-2 genomes and their use in diagnostic PCR primer design]] 본 위키페이지에서 다루는 내용과 100% 일치하지는 않습니다.  --- //[[hyjeong@kribb.re.kr|Haeyoung Jeong]] 2022/06/16 08:09//
 ===== 들어가는 글 ===== ===== 들어가는 글 =====
 COVID-19 진단을 위해 쓰이는 PCR 기법은 빠르게 발생하는 변이체에 의해 민감도가 떨어질 우려가 크다. 새롭게 보고된 바이러스 변이체의 게놈 정보를 이용하여 돌연변이가 발생한 위치를 피하여 PCR 프라이머를 설계하는 방법이 다음과 같이 소개되어서 이를 재현해 보는 것이 이 문서의 작성 취지이다. COVID-19 진단을 위해 쓰이는 PCR 기법은 빠르게 발생하는 변이체에 의해 민감도가 떨어질 우려가 크다. 새롭게 보고된 바이러스 변이체의 게놈 정보를 이용하여 돌연변이가 발생한 위치를 피하여 PCR 프라이머를 설계하는 방법이 다음과 같이 소개되어서 이를 재현해 보는 것이 이 문서의 작성 취지이다.
Line 6: Line 8:
 이 논문 말고도 엄청난 수의 SARS-CoV-2 검출용 PCR 기법이 넘쳐나고 있을 것이다. 이 논문을 택한 것은 이해하기 쉬운 기본 원리에 바탕을 두고 있고, 리눅스 컴퓨터에서 실행할 수 있는 튜토리얼 형태로 작성되어 있어서 따라하기에 좋기 때문이다.  이 논문 말고도 엄청난 수의 SARS-CoV-2 검출용 PCR 기법이 넘쳐나고 있을 것이다. 이 논문을 택한 것은 이해하기 쉬운 기본 원리에 바탕을 두고 있고, 리눅스 컴퓨터에서 실행할 수 있는 튜토리얼 형태로 작성되어 있어서 따라하기에 좋기 때문이다. 
  
-여러 DNA target을 공통적으로 증폭할 수 있는 프라이머를 설계하기 위하여 conserved region을 찾는 가장 보편적인 방법은 multiple sequence alignment(MSA)를 사용하는 것이다. 예를 들어서 EasyPrimer([[https://pubmed.ncbi.nlm.nih.gov/31992749/|논문]] [[https://skynet.unimi.it/index.php/tools/easyprimer/|웹사이트]])는 hypervariable gene을 공적으로 증폭할 프라이머를 설계하기에 적당한 위치를 찾아주는 역할을 하며, PrimerDesign-M([[https://pubmed.ncbi.nlm.nih.gov/25524896/|논문]] [[https://www.hiv.lanl.gov/content/sequence/PRIMER_DESIGN/primer_design.html|웹사이트]])은 MSA를 입력하여 프라이머를 만들 수 있다. +여러 DNA target을 공통적으로 증폭할 수 있는 프라이머를 설계하기 위하여 conserved region을 찾는 가장 보편적인 방법은 multiple sequence alignment(MSA)를 사용하는 것이다. 예를 들어서 EasyPrimer([[https://pubmed.ncbi.nlm.nih.gov/31992749/|논문]] [[https://skynet.unimi.it/index.php/tools/easyprimer/|웹사이트]])는 hypervariable gene을 공적으로 증폭할 프라이머를 설계하기에 적당한 위치를 찾아주는 역할을 하며, PrimerDesign-M([[https://pubmed.ncbi.nlm.nih.gov/25524896/|논문]] [[https://www.hiv.lanl.gov/content/sequence/PRIMER_DESIGN/primer_design.html|웹사이트]])은 MSA를 입력하여 프라이머를 만들 수 있다. 
  
 그러나 이 글에서 소개하는 Methods Mol Biol.의 방법은 시간이 많이 걸리는 MSA에 의존하지 않고 각 변이체 바이러스 게놈을 레퍼런스에 비교하여 변이의 위치를 VCF로 추출한 뒤 이를 병합한 다음, BED 파일로 전환하여 프라이머 설계용 reference 서열 위에 대/소문자로 변이 발생 위치를 표시하게 만든다. 이어서 Primer3의 파라미터를 조정하여 소문자(변이)가 3'-end에 오는 프라이머가 아닌 것을 고르게 한 뒤 MFEprimer로 최종 점검을 하는 방식을 취한다. 그러나 이 글에서 소개하는 Methods Mol Biol.의 방법은 시간이 많이 걸리는 MSA에 의존하지 않고 각 변이체 바이러스 게놈을 레퍼런스에 비교하여 변이의 위치를 VCF로 추출한 뒤 이를 병합한 다음, BED 파일로 전환하여 프라이머 설계용 reference 서열 위에 대/소문자로 변이 발생 위치를 표시하게 만든다. 이어서 Primer3의 파라미터를 조정하여 소문자(변이)가 3'-end에 오는 프라이머가 아닌 것을 고르게 한 뒤 MFEprimer로 최종 점검을 하는 방식을 취한다.
Line 35: Line 37:
         print $1"\t"($2-1)"\t"($2+length($5)-1)\         print $1"\t"($2-1)"\t"($2+length($5)-1)\
          }' all.variants.vcf > all.variants.bed          }' all.variants.vcf > all.variants.bed
-과연 이 awk 명령어가 제대로 작동하고 있는 것인가? 다음은 204번째 위치에서 G가 T로 치환된 것을 표시한 것이다. 샘플로 사용한 100개 게놈 서열에서는 모두 158회 출현한다. 0-based BED에서는 2,3번째 컬럼에서 각각 203(chromStart), 203(chromEnd)으로 표현해야 할 것 같다. 그런데 왜 chromEnd는 204인가? 반드시 chromStart < chromEnd여야 할 필요는 없을 것이다. 왜냐하면 길이가 1 bp에 불과한 feature도 얼마든지 있을 것이기 때문이다. 이것이 대단히 석연치 않다. 차라리 [[https://bedops.readthedocs.io/en/latest/content/reference/file-management/conversion/vcf2bed.html|vcf2bed]]와 같은 프로그램을 설치하여 테스트하는 것이 더 나을 수도 있다.+과연 이 awk 명령어가 제대로 작동하고 있는 것인가? 다음은 204번째 위치에서 G가 T로 치환된 것을 표시한 것이다. 샘플로 사용한 100개 게놈 서열에서는 모두 158회 출현한다. 0-based BED에서는 2,3번째 컬럼에서 각각 203(chromStart), 203(chromEnd)으로 표현해야 할 것 같다. 그런데 왜 chromEnd는 204인가? 반드시 chromStart < chromEnd여야 할 필요는 없을 것이다. 왜냐하면 길이가 1 bp에 불과한 feature도 얼마든지 있을 것이기 때문이다. 이것이 대단히 석연치 않다. 차라리 [[https://bedops.readthedocs.io/en/latest/content/reference/file-management/conversion/vcf2bed.html|vcf2bed]]와 같은 프로그램을 설치하여 테스트하는 것이 더 나을 수도 있다. <color #ed1c24>이것은 BED의 형식을 제대로 알지 못한 것에서 기인한 오해였다. 상세한 설명은 블로그 기록 [[https://blog.genoglobe.com/2021/12/vcf-bed.html|VFC 파일을 BED로 전환할 때 좌표 정보는 어떻게 바꾸어야 하는가]]를 참조하기 바란다.</color>
   [VCF 파일] NC_045512 204 . G T   [VCF 파일] NC_045512 204 . G T
   [BED 파일] NC_045512 203 204   [BED 파일] NC_045512 203 204
sars-cov-2_검출을_위한_pcr_프라이머_설계.1638516976.txt.gz · Last modified: by hyjeong