Letztes Mal habe ich vorgestellt, wie man mit PhytoMine-Python genetische Informationen erhält. Dieses Mal habe ich einen einfachen Weg gefunden, um die Sequenz eines Gens mit PhytoMine-Python zu erhalten, um mich daran zu erinnern.
Wählen Sie diesmal [Proteine] aus (https://phytozome.jgi.doe.gov/phytomine/aspect.do?name=Proteins).
Wählen Sie dieses Mal Populus trichocarpa.
Dann kommt der Python-Code heraus. Sie können diesen Code beim Kopieren und Einfügen verwenden. Da es sich um Python2 handelt, muss die print-Anweisung neu geschrieben werden. Ansonsten scheint sie so verwendet werden zu können, wie sie ist.
Das Folgende ist eine Modifikation, um die Daten der angegebenen Pflanzenarten im CSV-Format zu speichern.
import pandas as pd
from intermine.webservice import Service
service = Service("https://phytozome.jgi.doe.gov/phytomine/service")
query = service.new_query("Protein")
query.add_constraint("organism.shortName", "=", "P. trichocarpa", code = "A")
seq_df = []
for row in query.rows(size=size):
seq_df.append(row)
seq_df = pd.DataFrame(seq_df,columns=row.keys())
seq_df.to_csv("20201005_Proteins_Top20.csv")
Es wird so gespeichert.
Da dies eine Studie ist, versuche ich nur die ersten 20 Gene zu speichern, aber im Prinzip sollten alle Gene auf einmal gespeichert werden können.
Übrigens können Sie andere Sprachen aus dem Pulldown-Menü auswählen.
Recommended Posts