[PYTHON] Dies und das über pd.DataFrame

Einführung

Ein Memo über pandas.DataFrame (pd.DataFrame).

DataFrame-Initialisierung

#Leeren Sie den DataFrame
df = pd.DataFrame(columns=[Liste der Spaltennamen])

#Holen Sie sich aus der CSV-Datei
df = pd.read_csv([Dateipfad])
df = pd.read_csv([Dateipfad], names=[Liste der Spaltennamen])  #Ohne Header
df = pd.read_csv([Dateipfad], sep=',')  #Bei Angabe eines Trennzeichens
df = pd.read_csv([Dateipfad], delim_whitespace=True)  #Für Leerzeichen
df = pd.read_csv([Dateipfad], comment='#')  #Beim Einfügen von Kommentartext

Referenz: CSV / TsV-Datei mit Pandas lesen (read_csv, read_table)

Hinzufügen eines Wörterbuchs zu DataFrame

df = df.append([Wörterbuch], ignore_index=True)

Beachten Sie, dass im Gegensatz zu `append in der Liste df.append () `` den DataFrame nicht aktualisiert.

Extrahieren Sie Elemente aus DataFrame

#     'a' 'b'
# 0 |  1   2
# 1 |  3   4

#Element abrufen
df.loc[0,'a'] # -> 1

#Holen Sie sich Reihe
dist(df.loc[0,:]) # -> {'a':1, 'b':2}

#Spalte abrufen
list(df.loc[:,'a']) # -> [1, 3]

Referenz: Abrufen / Ändern des Werts einer Position mit Pandas unter, iat, loc, iloc

Extrahieren Sie Zeilen, die die Bedingungen erfüllen, aus DataFrame

#Einfache Bedingungen
df = df[df['num']>0]
df = df[df['str']=='Yes']
df = df[df['str'].isin(['Yes', 'No'])]  #Wenn es mehrere Kandidaten gibt

#Bedingung in Bezug auf die Zeichenfolge (wenn sie den fehlenden Wert NaN enthält)'na=False'Zu den Optionen)
df = df[df['str'].str.startswith('Y')]  #Erste Zeichenfolge
df = df[df['str'].str.contains('e')]  #Zeichenkette enthalten in
df = df[df['str'].str.endswith('s')]  #Zeichenkette am Ende

#Mehrere Bedingungen
df = df[(df['num']>0) & (df['str']=='Yes')]  #Anstelle von und&
df = df[(df['num']>0) | (df['str']=='Yes')]  #Anstelle von oder|

Referenz: Abfrage zum Extrahieren von Zeilen von pandas.DataFrame nach Bedingung

Andere

#Sortieren Sie nach der angegebenen Spalte
df = df.sort_values('a', ascending=True)

#Reindex
df = df.reset_index(drop=True)

#Speichern Sie DataFrame in einer CSV-Datei
df.to_csv([Dateipfad], index=False)

Recommended Posts

Dies und das über pd.DataFrame
matplotlib dies und das
Dies und das mit reflektieren
Zabbix API dies und das
Über _ und __
Dies und das haben wir von boost.python gelernt
Dies und das von Python-Eigenschaften
Dies und das mit NLTK (Memo)
Dies und das der Einschlussnotation.
Dies und das ist nützlich, wenn es mit nohup verwendet wird
Über Klasse und Instanz
Über Cumprod und Cummax
Über Kreuzvalidierung und F-Wert
Dies und das um MySQL in der Apache-Umgebung (Hinweis)
Linux (Über Dateien und Verzeichnisse)
Informationen zu Python-Objekten und -Klassen
Informationen zu Python-Variablen und -Objekten
Informationen zu LINUX-Dateien und -Prozessen
Über Raid Group und LUN
Informationen zur Funktion fork () und zur Funktion execve ()
Über Djangos Dekonstruktion und Dekonstruierbarkeit
Über Python, len () und randint ()
Informationen zu Python-Datums- und Zeitzone
Über Sharpe Ratio und Sortino Ratio
Über Python und reguläre Ausdrücke
Informationen zu Python- und Betriebssystemoperationen
Informationen zu http.Handle () und http.NewServeMux (). Handle ()
Python # Über Referenz und Kopie
Über Numpy Array und Asarray
Über Python sort () und reverse ()
Über Boxplot und Violinplot, die die Variation unabhängiger Daten visualisieren
Über den Fehler, dass Anaconda Numpy und Scipy nicht importieren kann
Informationen zur Installation der Serien Pwntools und Python2
Zusammenfassung und häufige Fehler zu Cron
Über Python-Diktat und sortierte Funktionen
Über Python und Cython dtype
Über MkDocs-Themen und ihre Bräuche
Über Python Pickle (cPickle) und Marschall
[Python] Über Executor und zukünftige Klassen
Über Python, aus und importieren, als
Über Zeitreihendaten und Übertraining
Über "spleeter", der Gesang und Musikinstrumente von Musikdaten trennen kann