Dies ist eine Sammlung von Pandas-Methoden, die ich oft benutze. Ich suche jedes Mal, wenn ich nicht weiß, wie ich es verwenden soll, aber es ist auch problematisch, so dass es ein Artikel als Memo für mich ist. (Geplant, jederzeit aktualisiert zu werden)
python
#Unterdrücken Sie die Anzeige des Float-Typs auf 3 Stellen nach dem Dezimalpunkt
pd.set_option('display.float_format', lambda x: '{:.3f}'.format(x))
#Auch wenn die Spalten standardmäßig weggelassen werden, werden alle Spalten mit dieser Einstellung angezeigt.
pd.set_option('display.max_columns', None)
python
#Pandas importieren
import pandas as pd
#Definieren Sie Daten, Indexnamen, Spaltennamen
val=[[1,2,3], [21,22,23], [31,32,33]]
index = ["row1", "row2", "row3"]
columns =["col1", "col2", "col3"]
#Erstellen Sie einen Datenrahmen, indem Sie den Index- und Spaltennamen angeben
df = pd.DataFrame(data=val, index=index, columns=columns)
python
#CSV-Datei(df.csv)Die erste Zeile wird als Kopfzeile gelesen und wird automatisch zum Spaltennamen.
df = pd.read_csv("df.csv")
python
#CSV-Datei(df.csv)Lesen, Spaltennamen werden automatisch serialisiert
df = pd.read_csv("df.csv",header=None)
python
#Säule.astype(Schimmel)でstrSchimmelに変更
df["A"] = df["A"].astype(str)
python
#Säule.apply(Funktion)で指定した列の全てのデータにFunktionを適用する
#Wenden Sie hier die Rundungsfunktion an
df["A"] = df["A"].apply(round)
#Säule.apply(Anonyme Funktion)Wenden Sie die Funktion auf alle Daten in der in angegebenen Spalte an
#Hier löscht die Split-Funktion die Zeichenfolgen nach dem Komma in allen Daten in Spalte A.
df["A"] = df["A"].apply(lambda x: x.split(",")[0])
python
#Kombinieren Sie die Datenrahmen d1 und d2 vertikal
df3 = pd.concat([df1,df2]).reset_index(drop=True)
#Kombinieren Sie die Datenrahmen d1 und d2 horizontal
df3 = pd.concat([df1,df2],axis=1).reset_index(drop=True)
python
#Säule.transform(Funktion)で指定した列の全てのデータにFunktionを適用する
#Füllen Sie für jede Gruppe in Spalte A die fehlenden Werte in Spalte B mit dem Medianwert von A in der Gruppe aus
df["B"] = df.groupby("A")["B"].transform(lambda x: x.fillna(x.median()))
python
#Speichern Sie den Spaltennamen mit Nulldaten in der Liste
null_col = df.isnull().sum()[df.isnull().sum()>0].index.tolist()
python
#Objekttyp Spaltenname ob_Als Liste in Spalte speichern
ob_col = df.dtypes[df.dtypes=="object"].index.tolist()
pandas hat viele nützliche Methoden und ich habe zu viel zu schreiben, aber ich werde es nach und nach aktualisieren.
Recommended Posts