User Tools

Site Tools


microbial_forensics

This is an old revision of the document!


Micronial Forensics

이 위키 페이지는 Petter Lindgren 등의 2019년 논문 A likelihood ratio-based approach for improved source attribution in microbiological forensic investigations에서 다룬 시나리오 1의 분석 과정을 학습하기 위하여 작성한 것입니다. 저자가 제공하는 원본 데이터 및 소스 프로그램(Perl & R)은 여기에 있습니다.

이 문서의 작성 목적은 방문자에게 논문을 설명하기 위한 것이 아니라 작성자 본인의 학습을 위한 것이므로 친절한 설명은 기대하지 않으시는 것이 좋겠습니다.

시나리오 1의 개요

Listeria monocytogenes에 의한 식중독은 미국에서 오염된 아이스크림의 섭취를 통해서 종종 발생하는 것으로 알려져 있습니다. 여기에서 다루어진 아웃브레이크는 참고문헌 29번의 것입니다. 가상의 사건에서는 두 개의 생산 시설 중에서 facility 1이 아웃브레이크를 일으킨 균주가 비롯된 것으로 고발되었습니다. 유전체 해독 데이터로부터 이를 어떻게 입증할 수 있을까요?

  • Hm: the source of the isolate from the patient was production facility 1,
  • Ha: the source of the isolate from the patient was not facility 2.

분석 과정(1) - 유전체 해독으로부터 distance matrix 작성까지

논문에 따르면 BioProject PRJNA215355에서 raw data를 가져다가 분석을 했다고 합니다. SNP 분석을 위해 reference로 삼은 균주는 SRR1917440에 해당합니다. 그러나 이 프로젝트는 미국 CFSAN에서 진행하는 L. monocytogenes의 whole genome sequencing program 전체와 관련된 것입니다. SNP 발굴, hamming distance 산출, phylogenetic tree 추론 등에 대해서는 논문 3쪽을 참고하십시오.

논문의 Results 섹션에서는 168 genome(two production faciliies, the environment, the studied outbreak, and earlier outbreak)의 재분석을 했다고 나와 있습니다. GitHub 사이트에서 제공한 selected_listeria_dist.csv에서는 148개 균주의 pairwise distance가 표현되어 있습니다. 반면에 metadata_listeria.txt에는 170개의 균주에 대한 메타데이터가 실려 있어서 약간 혼동을 초래합니다. metadata_listeria.txt 파일의 네번째 컬럼(source2)는 facility1, facility2 및 Environment의 어느 한가지 값을 반드시 갖습니다. “Clinical” 분리주의 경우에도 facility1 및 facility2라는 값이 매겨져 있는데, 이는 확정된 값이 아니라 본 연구를 통해 추정한 것이 아닐까 여겨집니다.

분석과정(2) - distance matrix에서 확률 밀도 함수(pdf) 구하기

plot_pdfs_from_distance_matrix.R은 distance matrix에서 pdf를 플로팅하는 R 소스입니다. plot_pdfs_from_distance_matrix()라는 R 함수를 선언하는 내용이 전부라서 데이터 파일을 추가하는 코드를 추가해야 합니다. 함수 앞부분에 포함된 코멘트를 살펴보도록 하겠습니다.

# function for plotting distances of within and between source distributions
# mat is a distance matrix
# index1 points out within source samples in matrix mat for the first group (only two groups allowed)

가장 먼저 할 일은

microbial_forensics.1633397927.txt.gz · Last modified: by hyjeong