Suche nach "gbff in gff konvertieren" Question: Converting Gbff To Gff3 Menschen, die ratlos sind, wenn sie den Inhalt solcher Diskussionen sehen
Für diejenigen, die Tools kennenlernen möchten, mit denen Life-Science-Daten in verschiedenen Formaten konvertiert werden können
Wenn Sie Genomdaten von NCBI erhalten --fasta Datei (.fasta) --genbank file (.gbff) Kann erhalten werden. Basissequenzinformationen (.fasta) + Annotationsdatei, die der Sequenz Geninformationen hinzufügt (**. Gbff **) Ermöglicht die Entschlüsselung des Genoms.
Wenn Sie diese Daten jedoch als Referenzgenom in IGV usw. verwenden möchten. Das IGV liest die Informationen nur, wenn die Anmerkungsdatei **. Gff ** (gff3) oder **. Gtf ** (gff2) lautet. (Die Erklärung des Dateiformats wird weggelassen)
Sowohl gbff (GenBank Flat File) als auch gff (General Feature Format) Kurz gesagt, da es sich um eine Anmerkungsdatei handelt, kann sie konvertiert werden? Als ich nach "gbff in gff konvertieren" suchte, fand ich eine Aufzeichnung solcher Diskussionen in der Vergangenheit, aber Es gibt keine spezifische Lösung.
Nachdem ich verschiedene Dinge recherchiert hatte, gelang es mir, eine Konvertierungsmethode zu finden, daher werde ich sie hier vorstellen.
Der Schlüssel zur Lösung lag in der zu Beginn vorgestellten Diskussion bei Biostars. Ein mysteriöses Skript namens "bp_genbank2gff3.pl". Es scheint, dass es mit bioperl verwendet werden kann, aber es scheint, dass es einen Fehler im Konversationsinhalt gibt. Vielleicht gibt es ein Tool ähnlich wie Python? Ich habe es gefunden, als ich es nachgeschlagen habe.
F. Wenn Sie ensembl verwenden, können Sie die Anmerkungsdatei als gff (gtf) -Datei abrufen. Warum also nicht gleich so schwer haben? A. Ich hatte nur Daten über ncbi, wahrscheinlich weil ich eine kleine Kreatur verwenden wollte ...
** 1. Biokonvert installieren **
pip install bioconvert
This method installs Bioconvert and its Python dependencies. Note, however, that bioconvert may use (depending on the conversion you want to use) external dependencies not available on Pypi. You will need to install those third-party dependencies yourself. An alternative is to install bioconvert using conda as explained here after. https://bioconvert.readthedocs.io/en/master/installation.html
Bei der Installation mit pip wird die Abhängigkeit des von PyPI verwalteten Python-Moduls gelöst, aber es scheint, dass die Abhängigkeit des Pakets eines Drittanbieters nicht gelöst wird. ** Kurz gesagt, die Installation mit Pip schränkt die Funktionalität ein. ** ** ** Es scheint, dass die Verwendung von conda auch die Abhängigkeiten in diesem Bereich löst. Ignorieren Sie diese Zeit, da nur & gbff → gff3 ohne Verwendung von conda konvertiert werden muss.
** 2. Wenn die Installation in der Mitte fehlschlägt (wahrscheinlich ein Fehler bei der Installation), installieren Sie auch das python3-devel-Paket **
yum install python3-devel
** 3. Biocode installieren **
pip install biocode
bioconvert --help
Wie oben erwähnt, ist die Funktion eingeschränkt und eine Warnung, dass einige Methoden nicht verfügbar sind, wird in einer Reihe angezeigt.
WARNING [bioconvert.core.base]: converter 'FASTQ2FASTA': method seqtk is not available
WARNING [bioconvert.core.base]: converter 'GENBANK2EMBL': method squizz is not available
WARNING [bioconvert.core.base]: converter 'GENBANK2FASTA': method squizz is not available
WARNING [bioconvert.core.base]: converter 'GZ2BZ2': method pigz_pbzip2 is not available
WARNING [bioconvert.core.base]: converter 'GZ2DSRC': method pigzdsrc is not available
genbank2gff3 genbank to-> gff3 (1 methods)
Für genbank2gff3 wird keine Warnung angezeigt, dass Sie diese Zeit verwenden möchten, sodass Sie sicher sein können. ~~ Seien Sie darauf vorbereitet, dass das Protokoll jedes Mal schmutzig wird, wenn Sie das Skript ausführen ~~
bioconvert genbank2gff3 foo.gbff foo.gff3
Kann von foo.gbff nach foo.gff3 konvertiert werden
Während der Konvertierung
WARNING: The following feature was skipped:
type: assembly_gap
location: [96782:96838](+)
qualifiers:
Key: estimated_length, Value: ['56']
Key: gap_type, Value: ['within scaffold']
Key: linkage_evidence, Value: ['paired-ends']
Informationen, die von gff3 nicht unterstützt werden, wie z. B., werden nicht in die gff3-Datei übertragen.
Siehe biokonvertierte Readme https://github.com/bioconvert/bioconvert
Recommended Posts