Ein Memo über pandas.DataFrame (pd.DataFrame).
#Leeren Sie den DataFrame
df = pd.DataFrame(columns=[Liste der Spaltennamen])
#Holen Sie sich aus der CSV-Datei
df = pd.read_csv([Dateipfad])
df = pd.read_csv([Dateipfad], names=[Liste der Spaltennamen]) #Ohne Header
df = pd.read_csv([Dateipfad], sep=',') #Bei Angabe eines Trennzeichens
df = pd.read_csv([Dateipfad], delim_whitespace=True) #Für Leerzeichen
df = pd.read_csv([Dateipfad], comment='#') #Beim Einfügen von Kommentartext
Referenz: CSV / TsV-Datei mit Pandas lesen (read_csv, read_table)
df = df.append([Wörterbuch], ignore_index=True)
Beachten Sie, dass im Gegensatz zu `append
in der Liste
df.append ()
`` den DataFrame nicht aktualisiert.
# 'a' 'b'
# 0 | 1 2
# 1 | 3 4
#Element abrufen
df.loc[0,'a'] # -> 1
#Holen Sie sich Reihe
dist(df.loc[0,:]) # -> {'a':1, 'b':2}
#Spalte abrufen
list(df.loc[:,'a']) # -> [1, 3]
Referenz: Abrufen / Ändern des Werts einer Position mit Pandas unter, iat, loc, iloc
#Einfache Bedingungen
df = df[df['num']>0]
df = df[df['str']=='Yes']
df = df[df['str'].isin(['Yes', 'No'])] #Wenn es mehrere Kandidaten gibt
#Bedingung in Bezug auf die Zeichenfolge (wenn sie den fehlenden Wert NaN enthält)'na=False'Zu den Optionen)
df = df[df['str'].str.startswith('Y')] #Erste Zeichenfolge
df = df[df['str'].str.contains('e')] #Zeichenkette enthalten in
df = df[df['str'].str.endswith('s')] #Zeichenkette am Ende
#Mehrere Bedingungen
df = df[(df['num']>0) & (df['str']=='Yes')] #Anstelle von und&
df = df[(df['num']>0) | (df['str']=='Yes')] #Anstelle von oder|
Referenz: Abfrage zum Extrahieren von Zeilen von pandas.DataFrame nach Bedingung
#Sortieren Sie nach der angegebenen Spalte
df = df.sort_values('a', ascending=True)
#Reindex
df = df.reset_index(drop=True)
#Speichern Sie DataFrame in einer CSV-Datei
df.to_csv([Dateipfad], index=False)
Recommended Posts