User Tools

Site Tools


bioinfo:72_prokaryotic_genomes

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
bioinfo:72_prokaryotic_genomes [2025/03/10 13:56] – [지금까지 내린 결론] hyjeongbioinfo:72_prokaryotic_genomes [2025/03/10 14:43] (current) – [최종 정리] hyjeong
Line 1: Line 1:
 ====== 72 prokaryotic genomes ====== ====== 72 prokaryotic genomes ======
  
-이 작업의 이해를 돕기 위한 상위 페이지: [[bioinfo:k-bds|Korea BioData Station (K-BDS)]]+  * 이 작업의 이해를 돕기 위한 상위 페이지: [[bioinfo:k-bds|Korea BioData Station (K-BDS)]] 
 +  * 결말을 알고 싶다면 이 문서 맨 마지막 항목인 [[https://genoglobe.com/kribb/bioinfo/72_prokaryotic_genomes#최종_정리|최종 정리]]를 먼저 클릭하여 읽는 것을 권장함 
  
 당시 시퀀싱되었던 균주는 KCTC 번호가 부여된 것(대부분 표준균주)이 가장 많으며, 여기에는 DMSZ나 ATCC에서 들여와서 KCTC의 정식 컬렉션이 된 것도 있다. 샘플 ID를 '숫자' 또는 '숫자T'로 표기한 것은 KCTC 자원으로서 숫자는 KCTC 번호에 해당한다. 시퀀싱 대상에는 당시 KCTC 소속 연구자가 연구 과정을 통해 개별적으로 분리·동정한 것 또는 외부에서 입수한 것 소수를 포함한다. 이런 부류의 것은 대부분 공식 KCTC 컬렉션이 아니다.  당시 시퀀싱되었던 균주는 KCTC 번호가 부여된 것(대부분 표준균주)이 가장 많으며, 여기에는 DMSZ나 ATCC에서 들여와서 KCTC의 정식 컬렉션이 된 것도 있다. 샘플 ID를 '숫자' 또는 '숫자T'로 표기한 것은 KCTC 자원으로서 숫자는 KCTC 번호에 해당한다. 시퀀싱 대상에는 당시 KCTC 소속 연구자가 연구 과정을 통해 개별적으로 분리·동정한 것 또는 외부에서 입수한 것 소수를 포함한다. 이런 부류의 것은 대부분 공식 KCTC 컬렉션이 아니다. 
Line 396: Line 397:
 {{ :bioinfo:sample_history.png?400 |}} {{ :bioinfo:sample_history.png?400 |}}
  
-실은 그 사이에 많은 실수가 있었다. 56개 샘플의 KRA 등록 후 검수를 기다리는 지금조차도 오타를 수정해야 할 것을 발견하였다. 1월부터 2월 23일까지 ZGA와 GTDB-Tk를 대충 10번 이상씩은 돌린 것 같다. 최종적으로 KAP241464로 등록하였다.+실은 그 사이에 많은 실수가 있었다. 56개 샘플의 KRA 등록 후 검수를 기다리는 지금조차도 오타를 수정해야 할 것을 발견하였다. 1월부터 2월 23일까지 ZGA와 GTDB-Tk를 대충 10번 이상씩은 돌린 것 같다. 최종적으로 KAP241464로 등록하였다. Low quality로 오해했다가 나중에 되살리게 된 KIM3(KB03으로 균주명 변경)은 2025년 3월 10일에 등록을 시작하였다.
 ==== KNA 등록 ==== ==== KNA 등록 ====
  
Line 410: Line 411:
      
 ===== 최종 정리 ===== ===== 최종 정리 =====
 +이 위키문서는 완벽하지 않다는 고백부터 하고 싶다. 완벽하게 설계한 계획에 따라 처음부터 끝까지 한번에 진행된 것이 아니기 때문이다. FASTQ raw data file에 포함된 오류, 프로그램 설치 오류 등이 중간에 발견되어 다시 처음으로 돌아간 일이 부지기수로 많았다. 예를 들어 GTDB-Tk는 1월 13일부터 3월 1일까지 총 11회를 실행하였다. 샘플의 이름이 바뀌고 quality 및 공개 여부에 따라 그룹이 바뀐 것도 많다. 따라서 가장 마지막에 위치한 이 섹션부터 읽는 것이 전체 상황을 파악하는데 더 도움이 될 수도 있다.
 +
 +  * Etc - [[https://kbds.re.kr/KAP241424|KAP241424]] Examples of low quality Illumina sequencing of prokaryotic genomes. 8 samples(이중에서 KIM3는 KB03으로 되살려서 KRA/KNA에 등록 중)
 +  * KRA - [[https://kbds.re.kr/KAP241464|KAP241464]] Genome sequencing of microbial strains collected by Korean Collection for Type Cultures (KCTC). 56 samples이며, 이에 대한 KNA 데이터는 검수 중
 +  * KRA - [[https://kbds.re.kr/KAP241474|KAP241474]] Methanobrevibacter smithii KB03 genome sequencing. 이어서 KNA 데이터 등록 예정
 +  * Label-sample mismatch가 있는 8건의 샘플은 등록하지 않음 
 +
 +5개의 바이오프로젝트 전체를 아우를 umbrella project를 등록할 예정이다. 그러나 적당한 title/project로 쓸 문구가 이제는 없다. 너무나 많은 프로젝트를 생성한 것이 잘못이다.
 + 
  
  
bioinfo/72_prokaryotic_genomes.1741582577.txt.gz · Last modified: 2025/03/10 13:56 by hyjeong