[PYTHON] Zusammenfassung der häufig verwendeten Methoden bei Pandas

Dies ist eine Sammlung von Pandas-Methoden, die ich oft benutze. Ich suche jedes Mal, wenn ich nicht weiß, wie ich es verwenden soll, aber es ist auch problematisch, so dass es ein Artikel als Memo für mich ist. (Geplant, jederzeit aktualisiert zu werden)

Datenrahmen-Anzeigeeinstellung (set_option)

python


#Unterdrücken Sie die Anzeige des Float-Typs auf 3 Stellen nach dem Dezimalpunkt
pd.set_option('display.float_format', lambda x: '{:.3f}'.format(x))

#Auch wenn die Spalten standardmäßig weggelassen werden, werden alle Spalten mit dieser Einstellung angezeigt.
pd.set_option('display.max_columns', None)

Erstellen eines Datenrahmens (DataFrame)

python


#Pandas importieren
import pandas as pd

#Definieren Sie Daten, Indexnamen, Spaltennamen
val=[[1,2,3], [21,22,23], [31,32,33]]
index = ["row1", "row2", "row3"]
columns =["col1", "col2", "col3"]

#Erstellen Sie einen Datenrahmen, indem Sie den Index- und Spaltennamen angeben
df = pd.DataFrame(data=val, index=index, columns=columns)

Erstellen Sie einen Datenrahmen aus dem Lesen einer CSV-Datei (read_csv).

python


#CSV-Datei(df.csv)Die erste Zeile wird als Kopfzeile gelesen und wird automatisch zum Spaltennamen.
df = pd.read_csv("df.csv")

Erstellen Sie einen Datenrahmen aus dem Lesen einer CSV-Datei (ver ohne Spaltennamen).

python


#CSV-Datei(df.csv)Lesen, Spaltennamen werden automatisch serialisiert
df = pd.read_csv("df.csv",header=None)

Datentyp ändern (Astyp)

python


#Säule.astype(Schimmel)でstrSchimmelに変更
df["A"] = df["A"].astype(str)

Funktion anwenden

python


#Säule.apply(Funktion)で指定した列の全てのデータにFunktionを適用する
#Wenden Sie hier die Rundungsfunktion an
df["A"] = df["A"].apply(round)

#Säule.apply(Anonyme Funktion)Wenden Sie die Funktion auf alle Daten in der in angegebenen Spalte an
#Hier löscht die Split-Funktion die Zeichenfolgen nach dem Komma in allen Daten in Spalte A.
df["A"] = df["A"].apply(lambda x: x.split(",")[0])

Concat-Datenrahmen

python


#Kombinieren Sie die Datenrahmen d1 und d2 vertikal
df3 = pd.concat([df1,df2]).reset_index(drop=True)
#Kombinieren Sie die Datenrahmen d1 und d2 horizontal
df3 = pd.concat([df1,df2],axis=1).reset_index(drop=True)

Transformieren Sie Daten, die in anderen Spalten gruppiert sind

python


#Säule.transform(Funktion)で指定した列の全てのデータにFunktionを適用する
#Füllen Sie für jede Gruppe in Spalte A die fehlenden Werte in Spalte B mit dem Medianwert von A in der Gruppe aus
df["B"] = df.groupby("A")["B"].transform(lambda x: x.fillna(x.median()))

Fehlende Spalte des Datenrahmens auflisten (isnull)

python


#Speichern Sie den Spaltennamen mit Nulldaten in der Liste
null_col = df.isnull().sum()[df.isnull().sum()>0].index.tolist()

Listen Sie die Datentypen der Spalten im Datenrahmen auf (dtypes).

python


#Objekttyp Spaltenname ob_Als Liste in Spalte speichern
ob_col = df.dtypes[df.dtypes=="object"].index.tolist()

pandas hat viele nützliche Methoden und ich habe zu viel zu schreiben, aber ich werde es nach und nach aktualisieren.

Recommended Posts

Zusammenfassung der häufig verwendeten Methoden bei Pandas
Zusammenfassung der häufig verwendeten Grammatik bei Pandas
Zusammenfassung dessen, was bei 100 Pandas-Schlägen verwendet wurde (# 1 ~ # 32)
Zusammenfassung der beim Extrahieren von Daten verwendeten Pandas-Methoden [Python]
Zusammenfassung der häufig verwendeten Befehle in matplotlib
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Verarbeiten von Memos, die häufig bei Pandas (Anfängern) verwendet werden
Vollständige Offenlegung der beim maschinellen Lernen verwendeten Methoden
Zusammenfassung der in Command Line Vol.8 verwendeten Tools
Zusammenfassung der in Command Line Vol.5 verwendeten Tools
Zusammenfassung der beim maschinellen Lernen verwendeten Bewertungsfunktionen
Selenium Webdriver Zusammenfassung der häufig verwendeten Betriebsmethoden
Zusammenfassung der von Pandas 1 häufig ausgeführten Prozesse (CSV-, Excel-Datei-bezogene Vorgänge)
Sammlung von Numpy, Pandas Tipps, die häufig auf dem Feld verwendet werden
Eine Code-Sammlung, die häufig in persönlichem Python verwendet wird
Einstellungen, die häufig in Jupyter verwendet werden
Zusammenfassung der grundlegenden Verwendung von Pandas
Zusammenfassung der statistischen Datenanalysemethoden mit Python, die im Geschäftsleben verwendet werden können
Zusammenfassung der von Pandas 2 häufig ausgeführten Prozesse (Datenreferenz, Bearbeitungsvorgang)
Ich habe versucht, den in Pandas häufig verwendeten Code zusammenzufassen
Zusammenfassung zum Schreiben von in gRPC verwendeten .proto-Dateien
Eine Sammlung von Methoden, die beim Aggregieren von Daten mit Pandas verwendet werden
Funktionen von pd.NA in Pandas 1.0.0 (rc0)
Zusammenfassung verschiedener Operationen in Tensorflow
[Anaconda3] Zusammenfassung häufig verwendeter Befehle
Installationszusammenfassung, die häufig für AI-Projekte verwendet wird
[Python] Zusammenfassung der Verwendung von Pandas
Zusammenfassung der häufig verwendeten Befehle von Django (Anfänger)
Zusammenfassung der Methoden zur automatischen Ermittlung von Schwellenwerten
Festplattenbezogene Befehle, die häufig in Ubuntu verwendet werden (Hinweise)
[Linux] Liste der in der Praxis verwendeten Linux-Befehle
Zusammenfassung verschiedener for-Anweisungen in Python
Zusammenfassung der Stolpersteine bei der Installation von CaboCha
Zusammenfassung der Module und Klassen in Python-TensorFlow2-
Zusammenfassung der häufig mit asyncpg ausgeführten Vorgänge
Zusammenfassung der Wahrscheinlichkeitsverteilungen, die häufig in Statistiken und Datenanalysen vorkommen
Python scikit-learn Eine Sammlung von Tipps für Vorhersagemodelle, die häufig im Feld verwendet werden
Zusammenfassung zum Importieren von Dateien in Python 3
Liste häufig verwendeter integrierter Funktionen und Methoden
Techniken, die häufig bei der Python-Kurzcodierung verwendet werden (Notepad)
Persönliche Notizen zu Pandas-bezogenen Vorgängen, die in der Praxis verwendet werden können
Verwendung von rekursiven Funktionen, die bei Wettbewerbsprofis verwendet werden
Zusammenfassung der Verwendung von MNIST mit Python
Der Header ist falsch ausgerichtet mit read_csv () und read_table () von Pandas
Korrigieren Sie die Argumente der in map verwendeten Funktion
Häufig verwendete Methoden von Selen und schöner Suppe
Zusammenfassung häufig verwendeter Python-Arrays (für mich)
Code, der häufig in Python / Django-Apps verwendet wird [Präfekturen]
Zusammenfassung häufig verwendeter Befehle (mit kleinem Kommentar)
Python scikit-learn Eine Sammlung von Tipps für Vorhersagemodelle, die häufig im Feld verwendet werden
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.
Zusammenfassung der Fehlerbehandlungsmethoden bei der Installation von TensorFlow (2)
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
[Einführung in Python] Zusammenfassung der Funktionen und Methoden, die häufig in Python vorkommen [Problemformat]
[Python] Einführung in das WEB-Scraping | Zusammenfassung der Methoden, die mit dem Webdriver verwendet werden können
Wird ab der Einführung von Node.js in der WSL-Umgebung verwendet
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden