[PYTHON] Hinweise zur Verwendung beim Kombinieren von pandas.DataFrame
Wenn ich Daten mit Pandas kombiniere, weiß ich immer nicht, welche Methode ich verwenden soll. Deshalb habe ich "einen groben Vergleich von Join, Merge und Concat" und "persönlichen Gebrauch" zusammengefasst.
API-Vergleich
- pandas.concat
- Im Gegensatz zu Zusammenführen und Verbinden können Sie die Verbindungsachse angeben
- Geben Sie die Verbindungsachse mit der Achse an (0: Index (Standard), 1: Spalte).
- Geben Sie die Join-Methode mit Join an (inner, Outer (Standard)).
- pandas.merge
- Viele Optionen im Vergleich zum Beitritt
- Geben Sie die Spalte an, die der Verknüpfungsschlüssel mit on sein soll
- Geben Sie die Verbindungsmethode mit wie an (links, rechts, außen, innen (Standard)).
- pandas.DataFrame.join
- Im Gegensatz zu Merge und Concat handelt es sich um eine Methode von pandas.DataFrame anstelle von pandas
- Weniger Optionen im Vergleich zum Zusammenführen
- Geben Sie die Spalte an, die der Verknüpfungsschlüssel mit on sein soll
- Geben Sie die Verbindungsmethode mit wie (links (Standard), rechts, außen, innen) an.
Wie man persönlich benutzt
- Wenn Sie eine relativ einfache Verknüpfung wünschen, pandas.DataFrame.join (im Grunde scheint dies ausreichend zu sein)
- Wenn Sie einen relativ komplizierten Join erstellen möchten, wählen Sie pandas.merge (wenn der Beitritt schwierig erscheint).
- Wenn Sie Daten einfügen möchten, pandas.concat (Bild, um Daten hinzuzufügen, anstatt sich anzuschließen)
Referenz
Pandas Benutzerhandbuch "Zusammenführen und Verbinden und Verketten" (offizielle japanische Übersetzung des Dokuments)
Zusammenführen, beitreten (Spalten- / Indexkriterien)
Concat, Merge, Join-Python, um DataFrame horizontal zu verbinden