User Tools

Site Tools


bioinfo

Bioinformatics Resources

일러두기

이 사이트는 인터넷을 둘러보시는 여러분들에게 미생물 유전체정보학 또는 생명정보학 지식을 체계적으로 전달하기 위해 만든 것이 결코 아닙니다. 그저 제 기억을 보조하기 위한 수단으로 글을 쓰기 시작하였고, 혹여 제 위키사이트 방문자에게 도움이 되었다면 영광이겠습니다. Genome sequencing 기술이 끝없이 발달하고 있으므로 여기에 작성된 글 중 수 년이 지난 것은 이미 현실에 맞지 않을 것입니다.

소박한 위키 엔진으로 구동되는 이곳은 새롭게 작성하거나 업데이트된 글들의 현황을 첫머리에 보여주는 기능이 없습니다. 찾아보면 그런 기능을 구현하는 플러그인이 있는지도 모르겠습니다. 또한 블로그처럼 최신 글이 가장 처음에 나타나지도 않습니다. 따라서 특정 주제의 글을 찾으려면 오른쪽 위의 검색창, 오른쪽의 목차, 또는 사이트맵 기능을 사용하시기 바랍니다. 호스팅 사이트라서 본 사이트 내의 위키 페이지는 구글에서 검색이 되지도 않습니다. 이를 어떻게 해결할지에 대해서는 고민하는 중입니다. 생명정보학(주로 미생물 유전체의 해독과 분석)과 관련한 주요 글은 이 위키 사이트보다 오히려 제 개인 블로그에 더 많은 것이 현실입니다. 차라리 생명정보학에 관한 글은 블로그에 지속적으로 작성하되, 이 위키사이트에는 별도의 페이지를 만들어서 블로그에 올렸던 글의 제목과 링크를 게시하는 것을 심각하게 고려한 일도 있었습니다. 결국은 이 위키사이트에 모든 정보를 종합하여 Prokaryotic genome analysis manual이라는 이름으로 공개하게 되었습니다. 연구자로서 제 평생 업적 중 하나라고 생각하고 꾸준히 만들어 나가겠습니다. — Haeyoung Jeong 2023/08/17 09:47

중요한 알림 또는 글

—-

Main topic list

생명정보학 카테고리가 확정되면 왼쪽의 사이드바로 옮겨갈 수도 있음. 각 주제마다 별도의 페이지를 만들고, 그 내부에는 이 위키 내부에 작성된 페이지 및 외부의 링크를 수록함.


외부 생명정보학 교육 프로그램 참여 기록

2022년 미생물 유전체 분석 교육

2022년에 내가 강사로서 참여한 총 3회의 대면 교육에서는 Windows Subsystem for Linux(WSL)에서 실행할 수 있는 우분투 20.04 기반의 배포(distro)를 사전에 제공하였다. 일명 'KRIBBuntu-focal'인 이 배포에는 일루미나 및 long read의 조립과 평가 및 주석화, 그리고 ANI 계산 등에 필요한 프로그램이 이미 설치된 상태이다. 배포 파일(tar 파일로는 9.2 GB, egg로 압축하면 3.5 GB)은 꽤 사이즈가 크고 내부에 포함하고 있는 개별 프로그램의 재배포에 대한 라이선스 상황을 잘 알지 못하므로 개별적으로 요청하거나 KRIBBuntu-focal_2205 distro 제작 및 재설치 과정 문서를 참조하여 직접 설치해 보기 바란다.

KOBIC 제44회 차세대 생명정보학 교육 워크샵(7월 22일)

KRIBB 내부 교육(7월 14일)

미생물중앙은행사업(4월 7일)

WSL(Windows Subsystem for Linux)용의 distro를 만들어서 배포한 뒤 각자의 노트북 컴퓨터에서 실습 진행

2019 유전체 데이터 분석 교육 - 미생물 유전체 및 메타지놈 분석

1일차 강사로 참여(주제: 미생물 유전체의 해독과 분석)

  • 일시: 2019년 11월 11-12일
  • 장소: 판교테크노밸리 경기창조경제혁신센터 3층 강의실 2
  • 주최/주관: 산업통상자원부, 한국바이오협회(교육 일반 안내), (주)인실리코젠
  • BRIC 공고문 - 재직자 재교육 단기과정

실습용 서버 준비

2019 KSBi-BIML 2019 생물정보학 & 머쉰러닝 워크샵

  • 일시: 2019년 2월 20일
  • 장소: 서울대학교 글로벌공학교육센터

2018 PacBio User Group Meeting in Seoul

“Completing and polishing prokaryotic genome assemblies using PacBio long-read sequencing technology”라는 제목으로 발표를 하였다. 발표 자료(축약본) 발표자료 PDF도 나중에 업로드할것.

2017 4th Cho & Kim Genomics, 미래BIT융합교육사업단 공동주최 Bioinformatics Analysis Workshop

2일차 교육 주제인 비교유전체학 기반 종간 진화 분석에 흥미가 느껴져서 수강생 신분으로 참석하였다. 실습용 프로그램과 자료를 VirtualBox 가상머신(.ova)에 담아서 USB 플래시 드라이브로 제공하여 편의를 더하였다. 그러나 내가 가져간 노트북 컴퓨터는 보안 프로그램이 설치된 상태여서 외부의 USB 드라이브를 전혀 인식하지 못하였다. 정확히 말하자면 연구원 내 네트웍을 통해서 보안 정책을 받을 수 없는 상황이어서 아예 불능 상태가 된 것이었다. 다행스럽게도 주최측에서 노트북 컴퓨터를 대여해 주어서 무사히 실습을 마칠 수 있었다.

본 교육 과정에서 제공한 분석용 스크립트는 재사용 가치가 매우 높은 것이라서 실제로 내 시스템에서 복습을 한 뒤 정리하여 본 위키 페이지에 올렸다. 이번 교육 과정에서 다루어진 주제는 다음과 같다. 실습 환경을 가상머신으로 제공하였기에 프로그램의 설치에 대해서는 다루어지지 않았다.

  1. Genome resequencing analysis: bowtie2, Picard tools, GATK, SnpEff
  2. Transcriptome analysis: generalized linear model에 대한 소개, edgeR
  3. dN/dS를 이용한 종간 관계 분석: PAML, TAAS
  4. 이외에도 Cho & Kim Genomics에서 개발한 Bio Analysis Pro(BAP) server에 대한 소개도 있었다.

가상머신의 로그인 화면. 암호는 '1234'이다.

KOBIC 차세대 생명정보학 교육 프로그램

국가생명연구자원정보센터(KOBIC)에서는 Next-Generation Sequencing에 기반한 차세대 생명정보학 분야의 저변 확대를 위해 교육 워크샵을 실시하고 있다. 특히 제22차 교육 워크샵(2014년 10월)부터는 생명정보 컨설팅 전문기업인 (주)인실리코젠과 공동으로 프로그램이 진행되는 중이다. 참가자들의 편의를 위하여 28차(2015년 10월)과 30차(2016년 2월)에 열린 미생물 유전체 및 대사회로 분석 강좌의 실습 자료를 이곳에 공개한다. 30차 교육은 정원 제한에 의해 28차 교육에 참여하지 못한 신청자들을 위한 재교육으로서 강의 및 실습 내용은 거의 동일하다.

KOBIC 교육 지원 관련 사이트

이 페이지(30회 교육)에서 소개하는 것은 미생물 유전체 de novo assemby 및 후속 분석 기법 중 극히 일부에 불과하다. 강좌에서 미처 다루지 못한 심화적인 내용과 계속 발전 중에 있는 최신 기법으로 계속 업데이트해 나갈 것이다. 또한 앞으로 강사 혹은 수강생으로 본 교육 과정에 참여한 기록을 여기에 남길 예정이다.

제30회 2일차 교육(2016.2)

제33회 교육("데이터 과학을 위한 파이썬 기초" - 수강생으로 참석, 2016.10)

제37회 교육(R을 이용한 데이터 통계 분석 및 시각화 - 수강생으로 참석)

  • 일시 및 장소: 2017년 11월 30일-12월 1일, KT인재개발원(대전)
  • 강사: 인하대학교 통계학과 유동현 교수
  • R Studio를 이용한 통합 개발 환경 소개, 데이터 구조, 시각화 등을 실습함

미생물 유전체의 성공적인 de novo assembly를 위한 제안(Illumina)

미생물 유전체 해독의 기술적인 측면을 다룬 나의 최초의 논문은 An optimized strategy for genome assembly of Sanger/pyrosequencing hybrid data using available software (Genomics Inform 2008)이다. 당시는 최초의 차세대 유전체 해독기법인 Roche/454 pyrosequencing이 인기를 끌기 시작하던 시절이었다. Sanger data를 phred/phrap/consed에서 주무르던 것에 익숙했던 나에게 NGS는 새로운 도전이 되었다. 21C프론티어 미생물유전체활용기술개발사업단이 실질적으로 주도하였던 한국 미생물유전체 연구의 역사는 Recent progress of microbial genome projects in Korea (Biotechnol J 2008)에 발표하였다.

바야흐로 NGS 기술은 single molecule에서 실시간 서열 정보 획득을 실현한 3세대로 전환되었으며, One SMRT cell, one contig의 시대가 도래하였다. 이제는 미생물 유전체 해독을 하면서 더 이상 contig나 N50의 개념을 설명할 필요조차 없게 되었다. 이러한 과도기적인 입장에서 PacBio와 “재래식” NGS(2세대) 기법을 버무려서 최적의 미생물 유전체 해독을 하는 방법에 관한 논문 Toward Complete Bacterial Genome Sequencing Through the Combined Use of Multiple Next-Generation Sequencing Platforms (J Microbiol Biotechno 2016l)을 냈었다. 앞으로는 deep metagenomic sequencing 말고는 일루미나 데이터를 처리하는 기술의 발전이 더 진전될 것 같지도 않다. 그러나 과거에 생산한 데이터(당시에는 assembly 결과가 좋지 않아서 묻어둔 것들을 포함하여)를 계속 새로운 시각으로 재평가하는 일은 여전히 필요하다. 이러한 노력의 일환으로 일루미나 어셈블리가 실패하는 가장 중요한 요인 중 하나는 오염이며, k-mer analysis & filtering을 통해서 일부 개선이 가능하다는 논문인 Contamination as a major factor in poor Illumina assembly of microbial isolate genomes (bioRxiv 2016)을 발표하였다.

이 페이지에서는 일루미나 시퀀싱 데이터를 이용하여 최적의 미생물 유전체 서열을 조립하기 위한 방법을 기술하고자 한다. 링크

제2회 KOBIC 생명정보 분석 활용 워크샵

Lake Arrowhead 2016 meeting

10 년 만에 다시 찾은 Lake Arrowhead Microbial Genomic Conference는 genomics에서 metagenomics를 거쳐서 이제는 완전히 microbiome으로 변모해 있었다. 상세한 출장 내역은 보고서에 정리하였다. 이 학술행사에서 얻은 가장 중요한 성과는 미생물 유전체 분석을 위한 최신 기법(소프트웨어 및 데이터베이스)을 접할 수 있었다는 것이다. 이에 설명을 곁들인 간단한 목록을 소개하고자 한다. 추억의 사진 두 장과 함께.

  • MyTaxa: assign taxonomy to metagenomic fragments
  • The enveomics collection: a toolbox for specialized analysis of microbial genomes and metagenomes
  • iRep: in situ replication rates for uncultivated bacteria in microbial communities
  • MIDAS: an integrated pipeline for estimating strain-level genomic variation from metagenomic data
  • ggKbase
  • metawatt: metagenomic reads binner
  • STAMP: statistical analysis of taxonomic and functional profiles
  • MinHASH 알고리즘에 의한 long read assembler와 기타 도구
  • Pilon: automated assembly improvement and variant calling
  • ReaPepPipe: reference-guided assembler

FEMS 2017

유럽의 미생물학 관련 학술단체로 구성된 FEMS(Federation of European Microbiological Societies)는 매 2년을 주기로 개최된다. 2015년 네덜란드 마스트리히트에 이어서 2017년 대회는 스페인의 발렌시아에서 개최되었다. 포스터 발표를 겸하여 참석한 이번 학술대회에서는 항생제 내성, 메타지노믹스 등 소속 부서에서 중점적으로 다르는 연구 분야의 최신 동향을 파악하는데 특히 중점을 두었다. 상세한 참가 기록은 출장보고서를 참조할 것.

Lake Arrowhead Microbial Genomics (LAMG) 2018 meeting

2018년 LAMG는 9월 16일부터 20일까지 개최되었다. 다제내성 Acinetobacter baumannii의 비교유전체학적 분석에 관한 포스터를 발표하였다.

기타 외부 자료들

bioinfo.txt · Last modified: 2023/08/17 09:49 by hyjeong