to_be_renamed
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
to_be_renamed [2019/06/27 11:24] – [LS-BSR] hyjeong | to_be_renamed [2022/06/18 13:12] (current) – [Roary] hyjeong | ||
---|---|---|---|
Line 61: | Line 61: | ||
또한 RAST server에서 export한 GFF3 파일도 Roary에서 그대로 쓰일 수가 없다. 왜냐하면 염기서열이 뒷부분에 있지 않기 때문이다. 뿐만 아니라 gene 없이 cds feature만 있다는 것도 문제가 된다. 몇 가지를 테스트해 본 경험으로 가장 바람직한 것은, RAST에서 export한 GFF3 file에서 CDS feature만 골라낸 것 + '## | 또한 RAST server에서 export한 GFF3 파일도 Roary에서 그대로 쓰일 수가 없다. 왜냐하면 염기서열이 뒷부분에 있지 않기 때문이다. 뿐만 아니라 gene 없이 cds feature만 있다는 것도 문제가 된다. 몇 가지를 테스트해 본 경험으로 가장 바람직한 것은, RAST에서 export한 GFF3 file에서 CDS feature만 골라낸 것 + '## | ||
+ | Roary를 실행하면 십중팔구는 다음과 같은 메시지와 함께 GFF 파일을 수정하여 fixed_input_files 디렉토리에 복사하게 된다. 나중에 query_pan_genome 스크립트로 GFF 파일을 대상으로 하는 작업을 할 때에는 수정된 것을 써야 한다. | ||
+ | 2021/06/30 15:53:28 Input file contains duplicate gene IDs, attempting to fix by adding a unique suffix, new GFF in the fixed_input_files directory: | ||
=== Output files === | === Output files === | ||
{{: | {{: | ||
Line 80: | Line 82: | ||
=== Command line tool의 사용법 === | === Command line tool의 사용법 === | ||
- | 테스트를 해 보았는데 그 동작이 완벽한 것 같지는 않다. | + | 원본 GFF 파일이 아니라 roary가 수정한 것(fixed_input_files/ |
$ query_pan_genome -h # for help | $ query_pan_genome -h # for help | ||
$ query_pan_genome -a union *.gff # 결과물: pan_genome_results | $ query_pan_genome -a union *.gff # 결과물: pan_genome_results | ||
- | $ query_pan_genome -a intersection *.gff # 결과물: pan_genome_results | + | $ query_pan_genome -a intersection *.gff # 결과물: pan_genome_results |
# difference | # difference | ||
# complement | # complement |
to_be_renamed.1561602264.txt.gz · Last modified: (external edit)