[PYTHON] Konvertieren Sie die Genbank-Datei in die GFF-Datei

Suche nach "gbff in gff konvertieren" Question: Converting Gbff To Gff3 Menschen, die ratlos sind, wenn sie den Inhalt solcher Diskussionen sehen

Für diejenigen, die Tools kennenlernen möchten, mit denen Life-Science-Daten in verschiedenen Formaten konvertiert werden können

Hintergrund (es ist in Ordnung, es zu überspringen)

Klicken Sie hier, um
zu erweitern

Wenn Sie Genomdaten von NCBI erhalten --fasta Datei (.fasta) --genbank file (.gbff) Kann erhalten werden. Basissequenzinformationen (.fasta) + Annotationsdatei, die der Sequenz Geninformationen hinzufügt (**. Gbff **) Ermöglicht die Entschlüsselung des Genoms.

Wenn Sie diese Daten jedoch als Referenzgenom in IGV usw. verwenden möchten. Das IGV liest die Informationen nur, wenn die Anmerkungsdatei **. Gff ** (gff3) oder **. Gtf ** (gff2) lautet. (Die Erklärung des Dateiformats wird weggelassen)

Sowohl gbff (GenBank Flat File) als auch gff (General Feature Format) Kurz gesagt, da es sich um eine Anmerkungsdatei handelt, kann sie konvertiert werden? Als ich nach "gbff in gff konvertieren" suchte, fand ich eine Aufzeichnung solcher Diskussionen in der Vergangenheit, aber Es gibt keine spezifische Lösung.

Nachdem ich verschiedene Dinge recherchiert hatte, gelang es mir, eine Konvertierungsmethode zu finden, daher werde ich sie hier vorstellen.

Der Schlüssel zur Lösung lag in der zu Beginn vorgestellten Diskussion bei Biostars. Ein mysteriöses Skript namens "bp_genbank2gff3.pl". Es scheint, dass es mit bioperl verwendet werden kann, aber es scheint, dass es einen Fehler im Konversationsinhalt gibt. Vielleicht gibt es ein Tool ähnlich wie Python? Ich habe es gefunden, als ich es nachgeschlagen habe.

F. Wenn Sie ensembl verwenden, können Sie die Anmerkungsdatei als gff (gtf) -Datei abrufen. Warum also nicht gleich so schwer haben? A. Ich hatte nur Daten über ncbi, wahrscheinlich weil ich eine kleine Kreatur verwenden wollte ...

Werkzeuginstallation

Nutzungsumgebung

Zu installierendes Python-Modul

** 1. Biokonvert installieren **

pip install bioconvert

This method installs Bioconvert and its Python dependencies. Note, however, that bioconvert may use (depending on the conversion you want to use) external dependencies not available on Pypi. You will need to install those third-party dependencies yourself. An alternative is to install bioconvert using conda as explained here after. https://bioconvert.readthedocs.io/en/master/installation.html

Bei der Installation mit pip wird die Abhängigkeit des von PyPI verwalteten Python-Moduls gelöst, aber es scheint, dass die Abhängigkeit des Pakets eines Drittanbieters nicht gelöst wird. ** Kurz gesagt, die Installation mit Pip schränkt die Funktionalität ein. ** ** ** Es scheint, dass die Verwendung von conda auch die Abhängigkeiten in diesem Bereich löst. Ignorieren Sie diese Zeit, da nur & gbff → gff3 ohne Verwendung von conda konvertiert werden muss.

** 2. Wenn die Installation in der Mitte fehlschlägt (wahrscheinlich ein Fehler bei der Installation), installieren Sie auch das python3-devel-Paket **

yum install python3-devel

** 3. Biocode installieren **

pip install biocode
bioconvert --help

Wie oben erwähnt, ist die Funktion eingeschränkt und eine Warnung, dass einige Methoden nicht verfügbar sind, wird in einer Reihe angezeigt.

WARNING [bioconvert.core.base]:  converter 'FASTQ2FASTA': method seqtk is not available
WARNING [bioconvert.core.base]:  converter 'GENBANK2EMBL': method squizz is not available
WARNING [bioconvert.core.base]:  converter 'GENBANK2FASTA': method squizz is not available
WARNING [bioconvert.core.base]:  converter 'GZ2BZ2': method pigz_pbzip2 is not available
WARNING [bioconvert.core.base]:  converter 'GZ2DSRC': method pigzdsrc is not available
genbank2gff3        genbank to-> gff3 (1 methods)

Für genbank2gff3 wird keine Warnung angezeigt, dass Sie diese Zeit verwenden möchten, sodass Sie sicher sein können. ~~ Seien Sie darauf vorbereitet, dass das Protokoll jedes Mal schmutzig wird, wenn Sie das Skript ausführen ~~

Lauf

bioconvert genbank2gff3 foo.gbff foo.gff3

Kann von foo.gbff nach foo.gff3 konvertiert werden

Während der Konvertierung

WARNING: The following feature was skipped:
type: assembly_gap
location: [96782:96838](+)
qualifiers:
    Key: estimated_length, Value: ['56']
    Key: gap_type, Value: ['within scaffold']
    Key: linkage_evidence, Value: ['paired-ends']

Informationen, die von gff3 nicht unterstützt werden, wie z. B., werden nicht in die gff3-Datei übertragen.

Andere Dateiformate, die konvertiert werden können

Siehe biokonvertierte Readme https://github.com/bioconvert/bioconvert

Recommended Posts

Konvertieren Sie die Genbank-Datei in die GFF-Datei
Konvertieren Sie HTML in eine Textdatei
[Python] So konvertieren Sie eine Datenbankdatei in CSV
Zum HSV konvertieren
So konvertieren Sie Python in eine exe-Datei
Konvertieren Sie das Matplotlib-Diagramm in das EMF-Dateiformat
Konvertieren Sie GFF3 in MSS für die DDBJ-Übermittlung
Konvertieren Sie die psd-Datei in Python in png
Konvertieren Sie die SVG-Datei mit Python in png / ico
Konvertieren Sie 202003 bis 2020-03 mit Pandas
Konvertiere Kanji in Kana
Jupyter in py umwandeln
Konvertiere keras-yolo3 in onnx
Dikt in Array konvertieren
Konvertieren Sie json in Excel
Konvertieren Sie eine Textdatei mit hexadezimalen Werten in eine Binärdatei
So konvertieren Sie eine JSON-Datei mit Python Pandas in eine CSV-Datei
So konvertieren Sie ein Mel-Spektrogramm zurück in eine WAV-Datei
So konvertieren Sie Json-Dateien in das CSV- oder EXCEL-Format
Konvertieren Sie die XML-Datei im Pascal-VOC-Format in die JSON-Datei im COCO-Format
Konvertieren Sie eine hexadezimale Zeichenfolge in eine Binärzeichenfolge
[Python] Datum in Zeichenfolge konvertieren
Konvertieren Sie numpy int64 in python int
[Python] Liste in Pandas konvertieren [Pandas]
Laden Sie eine Datei in Dropbox hoch
Konvertieren Sie das Scratch-Projekt in Python
[Python] Konvertieren Sie Shift_JIS in UTF-8
Konvertieren Sie die IP-Adresse in eine Dezimalzahl
Konvertieren Sie SDF schnell in CSV
[Caffe] Konvertiert die mittlere Datei vom binären Proto-Format in das npy-Format
Konvertieren Sie Python 3.x-Code in Python 2.x.
Konvertieren Sie eine Excel-Datei für verschiedene Zwecke in Python in Text
Ich habe versucht, eine Python-Datei in eine EXE-Datei zu verwandeln (Rekursionsfehler unterstützt)
Konvertieren Sie nach dem Aufrufen der Shell-Datei unter Python CSV in Parkett.
Automatisch in py-Datei konvertieren, wenn die UI-Datei von PySide aktualisiert wird
Konvertieren Sie das Tweepy Status-Objekt in JSON
Konvertieren Sie .ipynb in .html (mit BatchFile)
Funktion zum Konvertieren von Excel-Spalten in Zahlen
[Python] Mit Python in eine CSV-Datei schreiben
Konvertieren Sie A4 PDF alle 2 Seiten in A3
Konvertieren Sie wma in mp3 auf dem Mac
Ausgabe in eine CSV-Datei mit Python
Konvertieren Sie einen Teil des japanischen Namens in ein Synonym
Schreiben Sie die Standardausgabe in eine Datei
Workflow zum Konvertieren der Formel (Bild) in Python
Konvertieren Sie die Liste mit Python in DataFrame
Konvertieren Sie Sätze mit gensim in Vektoren
So konvertieren Sie 0,5 in 1056964608 auf einmal
Python> Liste> Doppelte Liste in einfache Liste konvertieren
Konvertierung von pdf nach txt 2 [pyocr]
So konvertieren Sie das Tensorflow-Modell in Lite
Konvertieren Sie eine Zeichenfolge in ein Bild
[Python] Konvertiert natürliche Zahlen in Ordnungszahlen
Konvertieren Sie die Dezimalzahl in n-ary [Python]
Programm zum Konvertieren von Japanisch in Sendernamen
So konvertieren Sie von .mgz nach .nii.gz
Konvertieren Sie PDF in Image mit ImageMagick
So erstellen Sie eine Konfigurationsdatei