[PYTHON] Convertir le fichier genbank en fichier gff

Rechercher "convertir gbff en gff" Question: Converting Gbff To Gff3 Les gens qui sont perdus lorsqu'ils voient le contenu de ces discussions

Pour ceux qui veulent connaître des outils capables de convertir les données des sciences de la vie dans différents formats

Contexte (vous pouvez l'ignorer)

Cliquez pour développer

Lorsque vous obtenez des données génomiques du NCBI --fasta fichier (.fasta)

  • Fichier Genbank (.gbff) Peut être obtenu. Informations sur la séquence de base (.fasta) + fichier d'annotation qui ajoute des informations sur le gène à la séquence (**. Gbff **) Permet de déchiffrer le génome.

Cependant, si vous souhaitez utiliser ces données comme génome de référence dans IGV, etc. L'IGV ne lira pas les informations sauf si le fichier d'annotation est **. Gff ** (gff3) ou **. Gtf ** (gff2). (L'explication du format de fichier est omise)

Gbff (fichier plat GenBank) et gff (format des fonctionnalités générales) Bref, puisqu'il s'agit d'un fichier d'annotation, peut-il être converti? Quand j'ai recherché "convertir gbff en gff", j'ai trouvé un enregistrement de ces discussions dans le passé. Il n'y a pas de solution spécifique.

Après avoir recherché diverses choses, j'ai réussi à trouver une méthode de conversion, je vais donc la présenter ici.

La clé de la solution résidait dans la discussion aux biostars introduite au début. Un script mystérieux appelé "bp_genbank2gff3.pl". Il semble qu'il puisse être utilisé avec bioperl, mais il semble qu'il y ait un bogue dans le contenu de la conversation. Peut-être qu'il existe un outil similaire à python? Je l'ai trouvé quand je l'ai recherché.

Q. Si vous utilisez ensembl, vous pouvez obtenir le fichier d'annotation sous forme de fichier gff (gtf), alors pourquoi ne pas avoir une telle difficulté en premier lieu? R. Je n'avais que des données sur ncbi, probablement parce que je voulais utiliser une créature mineure ...

Installation d'outils

environnement d'utilisation

Module Python à installer

** 1. Installez bioconvert **

pip install bioconvert

This method installs Bioconvert and its Python dependencies. Note, however, that bioconvert may use (depending on the conversion you want to use) external dependencies not available on Pypi. You will need to install those third-party dependencies yourself. An alternative is to install bioconvert using conda as explained here after. https://bioconvert.readthedocs.io/en/master/installation.html

Lors de l'installation avec pip, cela résout la dépendance du module python géré par PyPI, mais il semble que cela ne résout pas la dépendance du paquet tiers. ** En bref, l'installation avec pip limite la fonctionnalité. ** ** Il semble que l'utilisation de conda résoudra également les dépendances dans ce domaine, Ignorez cette fois car il suffit de convertir & gbff → gff3 sans utiliser conda.

** 2. Si l'installation échoue au milieu (probablement un échec d'installation de mappy), installez également le package python3-devel **

yum install python3-devel

** 3. Installez le biocode **

pip install biocode
bioconvert --help

Comme mentionné ci-dessus, la fonction est limitée et un avertissement indiquant que certaines méthodes ne sont pas disponibles s'affiche dans une ligne.

WARNING [bioconvert.core.base]:  converter 'FASTQ2FASTA': method seqtk is not available
WARNING [bioconvert.core.base]:  converter 'GENBANK2EMBL': method squizz is not available
WARNING [bioconvert.core.base]:  converter 'GENBANK2FASTA': method squizz is not available
WARNING [bioconvert.core.base]:  converter 'GZ2BZ2': method pigz_pbzip2 is not available
WARNING [bioconvert.core.base]:  converter 'GZ2DSRC': method pigzdsrc is not available
genbank2gff3        genbank to-> gff3 (1 methods)

Aucun avertissement n'est affiché pour genbank2gff3 que vous souhaitez utiliser cette fois, vous pouvez donc être assuré. ~~ Soyez prêt pour que le journal se salisse à chaque fois que vous exécutez le script ~~

Courir

bioconvert genbank2gff3 foo.gbff foo.gff3

Peut être converti de foo.gbff à foo.gff3

Pendant la conversion

WARNING: The following feature was skipped:
type: assembly_gap
location: [96782:96838](+)
qualifiers:
    Key: estimated_length, Value: ['56']
    Key: gap_type, Value: ['within scaffold']
    Key: linkage_evidence, Value: ['paired-ends']

Les informations que gff3 ne prend pas en charge, telles que, ne sont pas transférées dans le fichier gff3.

Autres formats de fichiers pouvant être convertis

Voir le readme de bioconvert https://github.com/bioconvert/bioconvert

Recommended Posts

Convertir le fichier genbank en fichier gff
Convertir le HTML en fichier texte
[Python] Comment convertir un fichier db en csv
Convertir en HSV
Comment convertir Python en fichier exe
Convertir le graphique matplotlib au format de fichier emf
Convertir GFF3 en MSS pour la soumission DDBJ
Convertir un fichier psd en png en Python
Convertir un fichier svg en png / ico avec Python
Convertir 202003 en 2020-03 avec les pandas
Convertir les kanji en kana
Convertir jupyter en py
Convertir keras-yolo3 en ONNX
Convertir dict en tableau
Convertir json en Excel
Convertir un fichier texte avec des valeurs hexadécimales en fichier binaire
Comment convertir un fichier JSON en fichier CSV avec Python Pandas
Comment convertir un spectrogramme Mel en un fichier wav
Comment convertir des fichiers Json au format CSV ou au format EXCEL
Convertir le fichier XML au format Pascal VOC en fichier json au format COCO
Convertir une chaîne hexadécimale en binaire
[python] Convertir la date en chaîne
Convertir numpy int64 en python int
[Python] Convertir la liste en Pandas [Pandas]
Télécharger un fichier sur Dropbox
Convertir le projet Scratch en Python
[Python] Convertir Shift_JIS en UTF-8
Convertir l'adresse IP en décimal
Convertissez rapidement SDF en CSV
[Caffe] Convertit le fichier moyen du format proto binaire au format npy
Convertir le code python 3.x en python 2.x
Convertir un fichier Excel en texte en Python à des fins de comparaison
J'ai essayé de transformer un fichier Python en un EXE (erreur de récursivité prise en charge)
Après avoir appelé le fichier Shell sur Python, convertissez CSV en Parquet.
Convertir automatiquement en fichier py lorsque le fichier ui est mis à jour par PySide
Convertir l'objet Statut Tweepy en JSON
Convertir .ipynb en .html (avec BatchFile)
Fonction pour convertir des colonnes Excel en nombres
Convertir un PDF en documents par OCR
[Python] Ecrire dans un fichier csv avec Python
Convertir un PDF A4 en A3 toutes les 2 pages
Convertir WMA en MP3 sur Mac
Sortie vers un fichier csv avec Python
Convertir une partie du nom japonais en synonyme
Écrire la sortie standard dans un fichier
Workflow pour convertir une formule (image) en python
Convertir la liste en DataFrame avec python
Convertir des phrases en vecteurs avec gensim
Comment convertir 0,5 en 1056964608 en un seul coup
Python> liste> Convertir une double liste en une seule liste
Conversion de pdf en txt 2 [pyocr]
Comment convertir le modèle Tensorflow en Lite
Convertir une chaîne en image
[Python] Convertit les nombres naturels en nombres ordinaux
Convertir décimal en n-aire [python]
Programme pour convertir le japonais en nom de station
Comment convertir .mgz en .nii.gz
Convertir un PDF en image avec ImageMagick
Comment créer un fichier de configuration