Was passiert, wenn Sie zwei Daten in Pandas lesen und kombinieren?

Daten lesen

import pandas as pd

sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()

sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()

Zwei Daten wurden in den Datenrahmen geladen (sample001, sample002). Es sieht so aus, als könnten Sie die beiden Daten in der Spalte "data001" kombinieren.

Daten verbinden

merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()

Es ist leicht zu erkennen, dass "data001" die Join-Schlüsselwortzeichenfolge und "data003" die sample002-Daten sind. Ich spreche von "data002_x" und "data002_y". "Woher kommst du?", Richtig? (Nein, verstehen Sie wirklich? Der im ersten Argument der Zusammenführung angegebene Datenrahmen hat x) Ich mag es nicht, also möchte ich zumindest schnell verstehen können, woher die Daten stammen.

Wie Sie Ihren Namen geben

Mit der Option Suffixe können Sie eine Zeichenfolge angeben, die am Ende des neuen Spaltennamens hinzugefügt werden soll, wenn der Spaltenname mit Ausnahme des Verknüpfungsschlüssels dupliziert wird.

merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()

Oh, jetzt können Sie leicht erkennen, woher die Daten stammen!

Schließlich

Ich wünschte, ich könnte, aber ich wünschte, ich könnte am Anfang statt am Ende eine Zeichenkette hinzufügen. (Weil es SQL-ähnlich sein kann)

[PYTHON] Wo kommen Sie her

Wie Sie Ihren Namen geben

Schließlich