====== VSEARCH ====== 이 위키 페이지를 만든 것은 2025년, 그러나 오래전인 2018년 내 블로그에 [[https://blog.genoglobe.com/2018/02/usearch.html|Usearch 맛보기]]라는 글을 쓴 일이 있었다. VSEARCH는 Robert Edgar의 유명한 Usearch의 기능을 갖도록 만든(그리고 더 빠른?) 공개 소프트웨어이다. * [[https://github.com/torognes/vsearch|VSEARCH GitHub]] * * [[https://github.com/torognes/vsearch/wiki|VSEARCH wiki]] * https://github.com/torognes/vsearch/wiki/Clustering * [[https://vcru.wisc.edu/simonlab/bioinformatics/programs/vsearch/vsearch_manual.pdf|VSEARCH manual (PDF)]] ===== Dereplication ===== 옵션을 빼먹으면 나중에 귀찮아진다. $ vsearch --derep_fulllength Korea_plus_Delta.trimmed --uc cluster --output derep.fa --sizeout vsearch v2.21.1_linu x_x86_64, 125.7GB RAM, 32 cores https://github.com/tognes/vsearch Dereplicating file Korea_plus_Delta.trimmed 100% 339644176 nt in 11552 seqs, min 29097, max 29796, avg 29401 Sorting 100% 8530 unique sequences, avg cluster 1.4, median 1, max 205 Writing FASTA output file 100% Writing uc file, first part 100% Writing uc file, second part 100% Cluster 정보 파일은 USEARCH의 [[https://drive5.com/usearch/manual/opt_uc.html|UC 출력 파일]]과 같은 정보를 수록하고 있다.