bioinfo:plasmidprofiler
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
bioinfo:plasmidprofiler [2018/10/16 10:05] – [Your workplace] hyjeong | bioinfo:plasmidprofiler [2021/03/17 13:09] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
====== Plasmid Profiler ====== | ====== Plasmid Profiler ====== | ||
===== 개요 ===== | ===== 개요 ===== | ||
- | 블로그에 작성했던 글: [[http:// | + | 블로그에 작성했던 글: [[http:// |
==== 간단한 설명 ==== | ==== 간단한 설명 ==== | ||
Line 20: | Line 20: | ||
* plasmid finder replicon database along with genes of interest (supplied but user-modifiable; | * plasmid finder replicon database along with genes of interest (supplied but user-modifiable; | ||
- ([[https:// | - ([[https:// | ||
- | - ([[https:// | + | - ([[https:// |
- (BLAST) SRST2에서 확인된 plasmid sequence로 custom BLAST DB를 만든 뒤 이를 대상으로 PlasmidFinder DB 유래 116개 plasmid replicon을 검색한다(MegaBLAST). | - (BLAST) SRST2에서 확인된 plasmid sequence로 custom BLAST DB를 만든 뒤 이를 대상으로 PlasmidFinder DB 유래 116개 plasmid replicon을 검색한다(MegaBLAST). | ||
- (Plasmid Profiler R 패키지) Heat map에 의한 visualization | - (Plasmid Profiler R 패키지) Heat map에 의한 visualization | ||
Line 28: | Line 28: | ||
적당한 문서를 찾아볼 것. Galaxy docker image는 [[https:// | 적당한 문서를 찾아볼 것. Galaxy docker image는 [[https:// | ||
==== Docker Plasmid Profiler 실행 방법 ==== | ==== Docker Plasmid Profiler 실행 방법 ==== | ||
- | 루트 권한으로 다음과 같이 입력하라. | + | 루트 권한으로 다음과 같이 입력하라. 종료한 뒤에는 하드디스크에 아무것도 남지 않는다. |
# docker run -t -p 48888:80 phacnml/ | # docker run -t -p 48888:80 phacnml/ | ||
Line 35: | Line 35: | ||
**sftp를 통해서 대용량의 파일을 전송**하려면 다음과 같이 하여라. 웹 브라우저에서 전송 가능한 파일의 크기에는 한계가 있음에 유의할 것. | **sftp를 통해서 대용량의 파일을 전송**하려면 다음과 같이 하여라. 웹 브라우저에서 전송 가능한 파일의 크기에는 한계가 있음에 유의할 것. | ||
# docker run -i -t -p 48888:80 -p 8022:22 -v / | # docker run -i -t -p 48888:80 -p 8022:22 -v / | ||
- | sftp를 통한 파일 전송은 다음과 같이 8022번으로 접속하여 실행한다. | + | sftp를 통한 파일 전송은 다음과 같이 8022번으로 접속하여 실행한다. 파일이 저장되는 위치는 / |
$ sftp -v -oPort=8022 -o User=admin@galaxy.org localhost | $ sftp -v -oPort=8022 -o User=admin@galaxy.org localhost | ||
+ | |||
==== Running Plasmid Profiler ==== | ==== Running Plasmid Profiler ==== | ||
Line 43: | Line 44: | ||
- Shared Data > Data Libraries > Plasmid Profiler > Databases에서 pp_plasmid_database.fasta를 선택하여 Add to History를 실행한다. 이때 History를 새로 만든다. | - Shared Data > Data Libraries > Plasmid Profiler > Databases에서 pp_plasmid_database.fasta를 선택하여 Add to History를 실행한다. 이때 History를 새로 만든다. | ||
- 별도로 준비한 plasmidfinder_plusAMR2.fasta 파일을 Get Data 기능으로 업로드한다. | - 별도로 준비한 plasmidfinder_plusAMR2.fasta 파일을 Get Data 기능으로 업로드한다. | ||
- | - Sequence reads를 업로드하여 dataset collection을 만든다. 데이터 파일이 많다면 sftp(8022 포트)로 전송하는 것이 좋다. | + | - Sequence reads를 업로드하여 dataset collection을 만든다. 데이터 파일이 많거나, 파일 하나의 크기가 2GB를 넘어서 http 전송이 불가능하면 sftp(8022 포트)로 |
- | * Type은 fastqsanger 혹은 fastqsanger.gz으로 한다. 업로드 완료된 파일은 | + | * Type은 fastqsanger 혹은 fastqsanger.gz으로 한다. 업로드 완료된 파일은 오른쪽 History 창에 |
- | * 모든 fastq file을 선택하여 For all selected > Build List of Dataset Pairs를 실행한다. 작업이 완료되었는지는 History 창을 보면서 확인한다. 종종 Refresh history 버튼을 클릭하라. | + | * 모든 fastq file을 선택하여(맨 처음 히스토리에 등록한 database file 두 개는 제외) |
- | * fastq.gz을 업로드하였으면 Collection Operation > Unzip Collection을 선택하여 실행한다. 그런데 완료 여부를 알기가 어렵다. Paired fastq.gz을 업로드한 경우의 정상적인 실행 방법은 좀 더 알아봐야 한다. 그리고 워크플로우 내부에서 압축을 해체하는데 어차피 시간이 걸리니 압축을 하지 않은 원본을 ftp로 올리는 것이 더 나을지도 모른다. | + | * (여기는 좀 불확실하다. 정확한 사용법을 파악하기 전에는 압축을 해제한 fastq file을 사용하는 것을 권한다) |
* Interleaved file은 쓰지 못한다. 왜냐하면 PlasmidProfiler workflow가 사용할 파일은 paired end fastqs임이 명시되어 있기 때문이다. Workflow를 수정하지 않는 이상 불가능하다고 생각된다. | * Interleaved file은 쓰지 못한다. 왜냐하면 PlasmidProfiler workflow가 사용할 파일은 paired end fastqs임이 명시되어 있기 때문이다. Workflow를 수정하지 않는 이상 불가능하다고 생각된다. | ||
{{ : | {{ : | ||
+ | {{ : | ||
==== 작동 멈추기 ==== | ==== 작동 멈추기 ==== | ||
Line 60: | Line 62: | ||
{{ : | {{ : | ||
왜 나는 기본 워크플로우를 수정하려고 했는가? Plasmid profiler는 플라스미드 서열을 조립하여주는 도구가 아니다. 하지만 훌륭한 curated plasmid database에 대해 매핑(SRST2 - 정확히 말하자면 pathogen typing)까지 실시한다면 조립은 왜 못하겠는가? | 왜 나는 기본 워크플로우를 수정하려고 했는가? Plasmid profiler는 플라스미드 서열을 조립하여주는 도구가 아니다. 하지만 훌륭한 curated plasmid database에 대해 매핑(SRST2 - 정확히 말하자면 pathogen typing)까지 실시한다면 조립은 왜 못하겠는가? | ||
+ | |||
+ | 그렇다면 내가 원하는 중간 결과물은 어디에 있는가? 우선 오른쪽의 History 패널을 보라. Dataset pair => Reads => Remove beginning/ | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | 플로피디스크 아이콘을 클릭하면 파일로 저장할 수 있다. 파일 형식은 Galaxy617-[Fasta_Extract_Sequence_on_data_576_and_data_329__Fasta].fasta라서 샘플(균주) 이름이 직접적으로 드러나지 않으니 잘 관리해야 한다. 혹은 [i](View details) 아이콘을 클릭하여 표시되는 Job Information 항목에서 데이터 파일의 경로를 알 수 있다. | ||
+ | |||
+ | Full Path: | ||
+ | |||
+ | /export 디렉토리는 docker 실행 시에 / | ||
=== Haeyoung' | === Haeyoung' |
bioinfo/plasmidprofiler.1539651941.txt.gz · Last modified: (external edit)