Was passiert, wenn Sie zwei Daten in Pandas lesen und kombinieren?
import pandas as pd
sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()
sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()
Zwei Daten wurden in den Datenrahmen geladen (sample001, sample002). Es sieht so aus, als könnten Sie die beiden Daten in der Spalte "data001" kombinieren.
merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()
Es ist leicht zu erkennen, dass "data001" die Join-Schlüsselwortzeichenfolge und "data003" die sample002-Daten sind. Ich spreche von "data002_x" und "data002_y". "Woher kommst du?", Richtig? (Nein, verstehen Sie wirklich? Der im ersten Argument der Zusammenführung angegebene Datenrahmen hat x) Ich mag es nicht, also möchte ich zumindest schnell verstehen können, woher die Daten stammen.
Mit der Option Suffixe können Sie eine Zeichenfolge angeben, die am Ende des neuen Spaltennamens hinzugefügt werden soll, wenn der Spaltenname mit Ausnahme des Verknüpfungsschlüssels dupliziert wird.
merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()
Oh, jetzt können Sie leicht erkennen, woher die Daten stammen!
Ich wünschte, ich könnte, aber ich wünschte, ich könnte am Anfang statt am Ende eine Zeichenkette hinzufügen. (Weil es SQL-ähnlich sein kann)