[PYTHON] Wo kommen Sie her

Was passiert, wenn Sie zwei Daten in Pandas lesen und kombinieren?

import pandas as pd

sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()
89781cb2-5d55-73df-1acf-b17f433e7b07.jpeg
sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()
a66b2cc7-69c6-4bf2-dc4e-5f6e304a0578.jpeg

Zwei Daten wurden in den Datenrahmen geladen (sample001, sample002). Es sieht so aus, als könnten Sie die beiden Daten in der Spalte "data001" kombinieren.

merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()
e1d8f492-631d-fa42-493e-26e091c9c4ed.jpeg Es ist leicht zu erkennen, dass "data001" die Join-Schlüsselwortzeichenfolge und "data003" die sample002-Daten sind. Ich spreche von "data002_x" und "data002_y". "Woher kommst du?", Richtig? (Nein, verstehen Sie wirklich? Der im ersten Argument der Zusammenführung angegebene Datenrahmen hat x) Ich mag es nicht, also möchte ich zumindest schnell verstehen können, woher die Daten stammen.

Wie Sie Ihren Namen geben

Mit der Option Suffixe können Sie eine Zeichenfolge angeben, die am Ende des neuen Spaltennamens hinzugefügt werden soll, wenn der Spaltenname mit Ausnahme des Verknüpfungsschlüssels dupliziert wird.

merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()
a9c397c7-23ce-94aa-1a10-1af997cbe426.jpeg

Oh, jetzt können Sie leicht erkennen, woher die Daten stammen!

Schließlich

Ich wünschte, ich könnte, aber ich wünschte, ich könnte am Anfang statt am Ende eine Zeichenkette hinzufügen. (Weil es SQL-ähnlich sein kann)

Recommended Posts

Wo kommen Sie her
Überprüfen Sie, ob Sie ein Gelehrter sind
[Hinweis] Wo haben Sie Async verwendet?
Haben Sie Probleme mit "pipenv.exceptions.ResolutionFailure"?
Informationen zu der von Ihnen verwendeten Entwicklungsumgebung