PhytoMine-I hat versucht, mit Python die genetischen Informationen der Pflanze zu erhalten

Ich habe herausgefunden, dass es eine PhytoMine gibt, die die Daten von Phytozome von Python aufrufen kann, also habe ich es versucht. Phytozome ist ein Ort, der Pflanzenforschern vertraut ist, und ein geeigneter Ort, um die genomischen und genetischen Informationen verschiedener Pflanzenarten zu untersuchen.

PhytoMine ist eines der Register des Data Warehouse-Systems InterMine.

InterMine ist ein Open Source Data Warehouse-System, das unter LGPL2.1 lizenziert ist. InterMine wird verwendet, um eine Datenbank mit biologischen Daten zu erstellen, auf die über erweiterte Webabfragetools zugegriffen werden kann. Mit InterMine können Sie eine Datenbank aus einem einzelnen Dataset erstellen oder mehrere Datenquellen integrieren. Einige gängige biologische Formate werden unterstützt, und es gibt einen Rahmen für das Hinzufügen weiterer Daten. InterMine enthält eine benutzerfreundliche Weboberfläche, die "out of the box" funktioniert und einfach anzupassen ist. Aus Wikipedia "InterMine"

InterMine ist in verschiedenen Programmiersprachen verfügbar, einschließlich Python. Weitere Informationen finden Sie unter API- und Client-Bibliotheken.

Ich habe versucht, PhytoMine in Python zu verwenden, indem ich auf InterMine-Python Tutorial verwiesen habe. Die Installation erfolgte mit pip.

$ pip install intermine

Ich habe die Genfunktion und die Pflanzenart als Abfrage angegeben und versucht, eine Liste der Gene in Python zu erhalten. Die Liste wurde in Pandas erstellt. Der Quellcode lautet wie folgt.

size = 20 #Geben Sie die Anzahl der zu erfassenden Daten an

import pandas as pd
from intermine.webservice import Service

service = Service("https://phytozome.jgi.doe.gov/phytomine/service") #Erstellen Sie eine Instanz, indem Sie die PhytoMine-URL angeben
query = service.new_query("Gene") #Holen Sie sich genetische Informationen
query.add_constraint("briefDescription","CONTAINS","transcription factor") #Geben Sie die Genfunktion an(Bedingung A.)
query.add_constraint("name","CONTAINS","Eucgr") #Zu Beginn des Gennamens von Eucalyptus Grandis"Eucgr"Eukalyptus Grandis als Pflanzenart mit bezeichnen(Bedingung B.)
query.add_constraint("name","CONTAINS","Potri") #Zu Beginn des Papp-Gennamens"Potri"Bezeichnen Sie Pappel als Pflanzenart mit(Bedingung C.)
query.set_logic("A & (B | C)") #Einstellungen zur Untersuchung der Gene von Eucalyptus Grandis und Pappel(Bedingung A und Bedingung B oder Bedingung C.)

dfs = [] #Erstellen Sie eine leere Liste, um die Ausgabe zu speichern
for row in query.rows(size=size):
    dfs.append(pd.DataFrame(row.values(),index=row.keys()).T) #Daten abrufen und in Liste speichern

dfs = pd.concat(dfs) #Liste in Datenrahmen konvertieren
dfs.to_csv("Tree_TFs_Top20.csv")  #Speichern Sie den Datenrahmen im CSV-Format
Gene.briefDescription Gene.cytoLocation Gene.description Gene.genomicOrder Gene.id Gene.length Gene.name Gene.primaryIdentifier Gene.score Gene.scoreType Gene.secondaryIdentifier Gene.symbol
0 (1 of 102) PF00319 - SRF-type transcription fa... None None None 49560540 186 Potri.010G098100 Potri.010G098100 None None PAC:26981244 None
0 (1 of 102) PF00319 - SRF-type transcription fa... None None None 303626540 186 Potri.010G098100 Potri.010G098100 None None PAC:37221527 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 48348276 2263 Potri.007G090600 Potri.007G090600 None None PAC:27016559 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 48359640 1853 Potri.003G139300 Potri.003G139300 None None PAC:26998891 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 48837989 1051 Potri.005G168700 Potri.005G168700 None None PAC:27030760 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 49691741 1649 Potri.017G055400 Potri.017G055400 None None PAC:26983926 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 50099858 2177 Potri.005G077300 Potri.005G077300 None None PAC:27029242 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 50216626 2401 Potri.013G135600 Potri.013G135600 None None PAC:26993814 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 50231866 2179 Potri.019G102200 Potri.019G102200 None None PAC:27025339 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 303511172 2177 Potri.005G077300 Potri.005G077300 None None PAC:37265642 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 303527050 1051 Potri.005G168700 Potri.005G168700 None None PAC:37263387 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 303695561 2263 Potri.007G090600 Potri.007G090600 None None PAC:37252859 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 303799992 2401 Potri.013G135600 Potri.013G135600 None None PAC:37233326 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 303940612 2179 Potri.019G102200 Potri.019G102200 None None PAC:37260937 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 304098097 1649 Potri.017G055400 Potri.017G055400 None None PAC:37223899 None
0 (1 of 10) PTHR31657:SF9 - ETHYLENE-RESPONSIVE ... None None None 304255554 1853 Potri.003G139300 Potri.003G139300 None None PAC:37236557 None
0 (1 of 11) K08064 - nuclear transcription facto... None None None 49458724 4801 Potri.011G098400 Potri.011G098400 None None PAC:27000615 None
0 (1 of 11) KOG4282 - Transcription factor GT-2 ... None None None 174786351 2903 Eucgr.J01012 Eucgr.J01012 None None PAC:32033046 None
0 (1 of 11) KOG4282 - Transcription factor GT-2 ... None None None 174819386 2316 Eucgr.J02994 Eucgr.J02994 None None PAC:32035652 None
0 (1 of 11) KOG4282 - Transcription factor GT-2 ... None None None 175094637 2197 Eucgr.G03225 Eucgr.G03225 None None PAC:32071912 None

Auf der [Query Builder-Seite] von PhytoMine (https://phytozome.jgi.doe.gov/phytomine/customQuery.do) scheint es verschiedene Datentypen außer Genen zu geben, die für Abfragen verwendet werden können, daher werde ich es nach und nach versuchen. ich will

Recommended Posts

PhytoMine-I hat versucht, mit Python die genetischen Informationen der Pflanze zu erhalten
Ich habe versucht, die Filminformationen der TMDb-API mit Python abzurufen
Ich habe versucht, den Authentifizierungscode der Qiita-API mit Python abzurufen.
Ich habe versucht, die Entropie des Bildes mit Python zu finden
Ich habe versucht, die Standortinformationen des Odakyu-Busses zu erhalten
Holen Sie sich die Quelle der Seite unbegrenzt mit Python zu laden.
Ich habe versucht, die Effizienz der täglichen Arbeit mit Python zu verbessern
So erhalten Sie Informationen von Organisationen, Cost Explorer eines anderen AWS-Kontos bei Lambda (Python)
Ich habe versucht, CloudWatch-Daten mit Python abzurufen
Holen Sie sich CPU-Informationen von Raspberry Pi mit Python
Python-Skript zum Abrufen von Notizinformationen mit REAPER
Ich habe versucht, die Standardrolle neuer Mitarbeiter mit Python zu optimieren
So ermitteln Sie die Anzahl der Stellen in Python
Fügen Sie mit Matplotlib Informationen am unteren Rand der Abbildung hinzu
Ich habe versucht, mit Blenders Python script_Part 01 zu beginnen
Ich habe versucht, eine CSV-Datei mit Python zu berühren
Ich habe versucht, mit Blenders Python script_Part 02 zu beginnen
Ich habe versucht, die Tweets von JAWS DAYS 2017 mit Python + ELK einfach zu visualisieren
Versuchen Sie, den Inhalt von Word mit Golang zu erhalten
Ich habe versucht, die Spacha-Informationen von VTuber zu visualisieren
Ich habe versucht, das Problem mit Python Vol.1 zu lösen
Holen Sie sich mit Python den Betriebsstatus von JR West
[Python] Ich habe versucht, Json von Tintenfischring 2 zu bekommen
Holen Sie sich Alembic-Informationen mit Python
So erhalten Sie mit Python eine Liste der Dateien im selben Verzeichnis
Ich habe versucht, die Literatur des neuen Corona-Virus mit Python automatisch an LINE zu senden
Ich habe versucht, die String-Operationen von Python zusammenzufassen
Ich habe versucht, das Artikel-Update des Livedoor-Blogs mit Python und Selen zu automatisieren.
Ich habe versucht, die Eigenschaften der neuen Informationen über mit dem Corona-Virus infizierte Personen mit Wordcloud zu visualisieren
Ich habe versucht, die Verarbeitungsgeschwindigkeit mit dplyr von R und pandas von Python zu vergleichen
Beim 15. Offline-Echtzeitversuch habe ich versucht, das Problem des Schreibens mit Python zu lösen
Ich habe versucht, das Bild mit Python + OpenCV "gammakorrektur" zu machen
Ich habe versucht zu simulieren, wie sich die Infektion mit Python ausbreitet
Versuchen Sie, die Funktionsliste des Python> os-Pakets abzurufen
Ich habe versucht, mit TensorFlow den Durchschnitt mehrerer Spalten zu ermitteln
Ich habe versucht, die Zugverspätungsinformationen mit LINE Notify zu benachrichtigen
Mindestkenntnisse, um mit dem Python-Protokollierungsmodul zu beginnen
So gelangen Sie mit Vagrant in die Python-Entwicklungsumgebung
Ich habe versucht, verschiedene Informationen von der Codeforces-API abzurufen
[Einführung in Python] So erhalten Sie Daten mit der Funktion listdir
Link, um mit Python zu beginnen
Holen Sie sich das Wetter mit Python-Anfragen
Holen Sie sich das Wetter mit Python-Anfragen 2
So erhalten Sie die Python-Version
Erste Schritte mit Python
Holen Sie sich Wetterinformationen mit Python & Scraping
Ich habe versucht, das Problem von F02 zu lösen, wie man mit Python offline in Echtzeit schreibt
Ich schrieb einen Test in "Ich habe versucht, die Wahrscheinlichkeit eines Bingospiels mit Python zu simulieren".
Versuchen Sie, in die Datenbank zu importieren, indem Sie ShapeFile mit numerischen Informationen zum nationalen Land mit Python bearbeiten
Ich habe versucht, die Anfängerausgabe des Ameisenbuchs mit Python zu lösen
Ich habe versucht, den Index der Liste mithilfe der Aufzählungsfunktion abzurufen
So erhalten Sie die ID von Type2Tag NXP NTAG213 mit nfcpy
[Python] Ein Memo, das ich versucht habe, mit Asyncio zu beginnen
[Python] So erhalten Sie den ersten und den letzten Tag des Monats
Geben Sie den Inhalt von ~ .xlsx im Ordner mit Python in HTML aus
Ich habe versucht, mit Python eine Liste von Primzahlen zu erstellen