[PYTHON] Technique de création d'arbre phylogénétique moléculaire super facile que je ne veux enseigner à personne

Estimation d'arbre phylogénétique

Présentation d'une méthode de création d'arbre phylogénétique moléculaire ultra-simple à l'aide de la boîte à outils ETE.

NUP62.aa.fa.final_tree.png (Figure: à partir de http://etetoolkit.org/documentation/ete-build/)

Outils à utiliser

--BLAST (recherche de similarité de séquence) --MAFFT (alignement) https://mafft.cbrc.jp/alignment/server/ --trimAl (correction de l'alignement pour la construction de l'arbre phylogénétique), facultatif http://trimal.cgenomics.org/ --RAxML (calcul d'arbre physique) https://sco.h-its.org/exelixis/web/software/raxml/index.html

Écoulement brutal

  1. La séquence d'ARNr 16S (?) De l'espèce cible pour laquelle vous souhaitez voir la relation phylogénétique avec les espèces apparentées est recherchée pour la similitude de séquence par BLAST dans la base de données de séquences (ARNr 16S, RefSeq, nr, etc.), et la cible est basée sur les résultats. Récupérez la séquence d'autres espèces telles que le genre auquel appartient l'espèce. * Bien qu'elle soit ciblée pour les bactéries 16S sans autorisation, veuillez utiliser votre propre séquence.
  2. Récupérez la séquence d'ARNr 16S du non-genre (pour la rendre hors groupe de l'arbre phylogénétique).
  3. Rassemblez toutes les séquences de ↑ 1.2 dans un fichier FASTA et effectuez un alignement multiple avec MAFFT L-INS-i.
  4. Ajustez le résultat de l'alignement pour la construction de l'arbre phylogénétique à l'aide de trimAl (supprimez les zones inappropriées telles que les espaces lors du calcul de l'arbre phylogénétique). Cette étape est facultative et ne doit pas être effectuée.
  5. Construisez un arbre phylogénétique le plus probable en utilisant RAxML. Il calcule également la valeur bootstrap.
  6. Chargez l'arbre phylogénétique construit dans FigTree et dessinez-le. Ou dessinez avec iTOL (seul le Web est plus beau).
  7. Amusant (✿╹◡╹) v

mot-clé

Types d'arbres phylogénétiques: arbre non raciné, arbre enraciné, Méthode de calcul de l'arbre phylogénétique: méthode NJ, méthode la plus probable, méthode Bayes

Route de retour

Comment construire un arbre phylogénétique en un instant à l'aide de ETE Toolkit. C'était tellement amusant que j'avais vraiment peur. Je voulais vraiment en faire un produit d'information payant, mais pour être honnête, j'étais vraiment inquiet. Et j'ai réalisé que je réfléchissais sérieusement et sérieusement. Je voudrais le publier spécialement cette fois.

On suppose que Python et Anaconda sont inclus. Si non inclus / suspect → macOS: Note de l'installation de Homebrew à la création de l'environnement Anaconda pour Python avec pyenv Linux: Notes sur la construction de l'environnement Anaconda pour Python avec pyenv dans un environnement Linux

Environnement

$ pip install ete3 #Installer la boîte à outils ETE
$ conda install -c etetoolkit ete_toolchain #Installation des outils nécessaires

Construction d'arbres phylogénétiques

La grammaire est

$  ete3 build -w Nom du workflow-n Fichier de matrice d'entrée(Avant l'alignement) -o Nom du répertoire de destination de sortie--clearall

Exemple:

$  ete3 build -w mafft_linsi-none-none-raxml_default -n input.fasta -o output_tree --clearall

Seulement ça! Cela seul fera tout l'alignement multiple du tableau, le découpage de nombreuses zones d'espacement et l'estimation du système! !!

La syntaxe de ce workflow est ʻaligner-trimmer-tester-builderséparé par des tirets. Par exemple, le workflowmafft_linsi-none-none-raxml_default Ensuite, alignez-vous sur l'algorithme L-INS-i de mafft et construisez un arbre phylogénétique avec RAxML. Si Paisen du laboratoire utilise clustal pour l'alignement! Si vous ditesclustalo_default-none-none-raxml_default, il s'alignera en utilisant clustal omega (successeur de clustal w). Si vous souhaitez inclure le processus d'ajustement de la zone d'espacement de la séquence à l'aide de trimAl, Vous pouvez utiliser mafft_linsi-trimal01-none-raxml_default. Si vous souhaitez inclure le calcul de la valeur bootstrap lors de l'estimation de l'arbre phylogénétique Utilisez mafft_linsi-none-none-raxml_default_bootstrap` (cela prendra un certain temps).

・ Peut-être qu'il est prudent de dire mafft_linsi-none-none-raxml_default_bootstrap (désolé, désolé)

Les outils utilisables

$ ete3 build apps

Si tel est le cas, il sera affiché. Référence: composition de flux de travail personnalisés

Fichier résultat

Lorsque la commande de construction d'arbre phylogénétique dans l'exemple ci-dessus est exécutée, Il générera divers fichiers de résultats dans . / Output_tree / mafft_linsi-none-none-raxml_default. Il contient divers fichiers, ・ Input.fasta.final_tree.png → Un diagramme chara qui montre l'arbre phylogénétique et le diagramme schématique de la séquence alignée ensemble. ・ Input.fasta.final_tree.fa → Fichier fasta aligné ・ Input.fasta.final_tree.nw → Fichier d'arbre phylogénétique estimé. Si vous chargez ceci dans FigTree ou iTOL, vous pouvez obtenir une belle figure.

Référence: The ETE Cookbook

Recommended Posts

Technique de création d'arbre phylogénétique moléculaire super facile que je ne veux enseigner à personne
Je veux faire ○○ avec les Pandas
"CSI" que je souhaite enseigner aux débutants en production d'applications pour console interactive
[Linux] Vous ne disposez pas des privilèges root. Mais je veux yum installer.
Une bibliothèque pour la science des données "Je veux faire ça" sur le bloc-notes Jupyter
Je veux faire le test de Dunnett en Python
Je veux faire pyenv + pipenv même sous Windows
Voulez-vous que je corrige cette copie?
Fonctionnement pratique du clavier Linux que je veux apprendre moi-même quand j'étais à l'école