[PYTHON] Super einfache molekulare phylogenetische Baumerstellungstechnik, die ich niemandem beibringen möchte

Phylogenetische Baumschätzung

Einführung einer ultra-einfachen Methode zur Erstellung molekularer phylogenetischer Bäume mit dem ETE Toolkit.

NUP62.aa.fa.final_tree.png (Abbildung: Von http://etetoolkit.org/documentation/ete-build/)

Zu verwendende Werkzeuge

--BLAST (Sequenzähnlichkeitssuche)

Rauer Fluss

  1. Die 16S-rRNA-Sequenz (?) Der Zielspezies, für die Sie die phylogenetische Beziehung zu verwandten Spezies sehen möchten, wird von BLAST in der Sequenzdatenbank (16S-rRNA, RefSeq, nr usw.) nach Sequenzähnlichkeit durchsucht, und das Ziel basiert auf den Ergebnissen. Rufen Sie die Sequenz anderer Arten ab, z. B. die Gattung, zu der die Art gehört. * Obwohl sie ohne Erlaubnis für Bakterien 16S bestimmt ist, verwenden Sie bitte Ihre eigene Sequenz.
  2. Holen Sie sich die 16S-rRNA-Sequenz der Nicht-Gattung (um sie außerhalb des phylogenetischen Baums zu bilden).
  3. Sammeln Sie alle Sequenzen in ↑ 1.2. In einer FASTA-Datei und führen Sie eine Mehrfachausrichtung mit MAFFT L-INS-i durch.
  4. Passen Sie das Ausrichtungsergebnis für die phylogenetische Baumkonstruktion mit trimAl an (entfernen Sie ungeeignete Bereiche wie Lücken bei der Berechnung des phylogenetischen Baums). Diese Phase ist optional und muss nicht durchgeführt werden.
  5. Konstruieren Sie mit RAxML einen wahrscheinlichsten phylogenetischen Baum. Es berechnet auch den Bootstrap-Wert.
  6. Laden Sie den konstruierten phylogenetischen Baum in FigTree und zeichnen Sie ihn. Oder zeichnen Sie mit iTOL (nur webbasiert ist schöner).
  7. Spaß (✿╹◡╹) v

Stichwort

Arten von phylogenetischen Bäumen: unbewurzelter Baum, verwurzelter Baum, Phylogenetische Baumberechnungsmethode: NJ-Methode, wahrscheinlichste Methode, Bayes-Methode

Rückweg

So erstellen Sie mit dem ETE Toolkit im Handumdrehen einen phylogenetischen Baum. Es hat so viel Spaß gemacht, dass ich wirklich Angst hatte. Ich wollte es wirklich zu einem bezahlten Informationsprodukt machen, aber um ehrlich zu sein, war ich wirklich besorgt. Und mir wurde klar, dass ich ernsthaft und ernsthaft nachdachte. Ich möchte es diesmal speziell veröffentlichen.

Es wird angenommen, dass Python und Anaconda enthalten sind. Wenn nicht enthalten / verdächtig → macOS: Hinweis von der Installation von Homebrew zum Erstellen einer Anaconda-Umgebung für Python mit pyenv Linux: Hinweis zum Erstellen einer Anaconda-Umgebung für Python mit pyenv in einer Linux-Umgebung

Umgebung

$ pip install ete3 #Installieren Sie das ETE-Toolkit
$ conda install -c etetoolkit ete_toolchain #Installation der notwendigen Werkzeuge

Phylogenetische Baumkonstruktion

Die Grammatik ist

$  ete3 build -w Workflow-Name-n Array-Datei eingeben(Vor dem Ausrichten) -o Name des Ausgabeverzeichnisses ausgeben--clearall

Beispiel:

$  ete3 build -w mafft_linsi-none-none-raxml_default -n input.fasta -o output_tree --clearall

Nur das! Dies allein führt die Mehrfachausrichtung des Arrays, das Trimmen vieler Lückenbereiche und die Systemschätzung durch! !!

Die Syntax dieses Workflows lautet "Aligner-Trimmer-Tester-Builder", getrennt durch Bindestriche. Zum Beispiel der Workflow mafft_linsi-none-none-raxml_default Richten Sie sich dann mit dem L-INS-i-Algorithmus von mafft aus und erstellen Sie mit RAxML einen phylogenetischen Baum. Wenn Paisen vom Labor Clustal zur Ausrichtung verwendet! Wenn Sie "clustalo_default-none-none-raxml_default" sagen, wird es mit clustal omega (Nachfolger von clustal w) ausgerichtet. Wenn Sie den Prozess des Zuschneidens des Lückenbereichs der Sequenz mit trimAl einbeziehen möchten, Sie können mafft_linsi-trimal01-none-raxml_default verwenden. Wenn Sie die Berechnung des Bootstrap-Werts in die Schätzung des phylogenetischen Baums einbeziehen möchten Verwenden Sie mafft_linsi-none-none-raxml_default_bootstrap (es wird einige Zeit dauern).

・ Vielleicht ist es sicher zu sagen "mafft_linsi-none-none-raxml_default_bootstrap" (sorry, sorry)

Die Werkzeuge, die verwendet werden können

$ ete3 build apps

Wenn ja, wird es angezeigt. Referenz: Erstellen benutzerdefinierter Workflows

Ergebnisdatei

Wenn der Befehl zur phylogenetischen Baumkonstruktion im obigen Beispiel ausgeführt wird, Es werden verschiedene Ergebnisdateien in . / Output_tree / mafft_linsi-none-none-raxml_default generiert. Es gibt verschiedene Dateien darin, ・ Input.fasta.final_tree.png → Ein Chara-Diagramm, das den phylogenetischen Baum und das schematische Diagramm der ausgerichteten Sequenz zusammen zeigt. ・ Input.fasta.final_tree.fa → Ausgerichtete Fasta-Datei ・ Input.fasta.final_tree.nw → Geschätzte phylogenetische Baumdatei. Wenn Sie dies in FigTree oder iTOL laden, erhalten Sie eine schöne Figur.

Referenz: Das ETE-Kochbuch

Recommended Posts

Super einfache molekulare phylogenetische Baumerstellungstechnik, die ich niemandem beibringen möchte
Ich möchte ○○ mit Pandas machen
"CSI", das ich Anfängern der interaktiven Konsolenanwendungsproduktion beibringen möchte
[Linux] Sie haben keine Root-Rechte. Aber ich möchte yum installieren.
Eine Bibliothek für Datenwissenschaft "Ich möchte das tun" auf dem Jupyter Notebook
Ich möchte Dunnetts Test in Python machen
Ich möchte pyenv + pipenv auch unter Windows machen
Soll ich diese Kopie reparieren?
Praktische Linux-Tastaturbedienung, die ich mir selbst beibringen möchte, als ich in der Schule war