[PYTHON] Memorandum von Methoden zum Organisieren von Spalten in DataFrame

Methoden, die ich nach dem Lesen von kaggles Kernel nützlich fand

Vor kurzem habe ich angefangen, an Kaggle zu arbeiten, und es gab eine Methode, um die Verarbeitung von Spalten zu vereinfachen, die ich mir bemüht hatte, von Hand zu erstellen. Deshalb werde ich sie als Memorandum zusammenfassen. Nur die Verwendung, die in dem von uns durchgeführten Wettbewerb verwendet wird, wird kurz zusammengefasst. Springen Sie daher zu dem Artikel, auf den Sie sich bezogen haben, um eine detaillierte Verwendung zu erhalten.

Wenn Sie den gewünschten Wert anzeigen möchten

In dem Wettbewerb, den ich diesmal mache, existierten die angegebenen Daten als train_data und train_label, und es gab doppelte Elemente in den beiden csv. Letztendlich müssen diese beiden Daten kombiniert und dem Modell übergeben werden, sodass doppelte Inhalte vor dem Kombinieren ausgedünnt werden müssen.

Ich möchte mehrere Ziele nehmen und dieselbe Verarbeitung ausführen, z. B. Gruppierung nach Spalten

--groupby (['Name der ersten Spalte, die Sie gruppieren möchten``,' Name der zweiten Spalte, die Sie gruppieren möchten``]) Prozess, den Sie anwenden möchten.mean () oder seine Seite Berechnen Sie den Durchschnittspreis der Gruppe B, die zur Gruppe A gehört. Verwenden Sie es so. Der angegebene Spaltenname wird nicht dupliziert.

--agg ({`` Zu verarbeitender Spaltenname': ['Was Sie verarbeiten möchten 1 (min, max usw.)', Was Sie verarbeiten möchten 2`]}) Bequem nach Groupby zu verwenden

Artikel, auf die verwiesen wird

note.nkmk.me CUBE SUGAR CONTAINER

Recommended Posts

Memorandum von Methoden zum Organisieren von Spalten in DataFrame
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Zusammenfassung der Methoden zur automatischen Ermittlung von Schwellenwerten
Zusammenfassung verschiedener for-Anweisungen in Python
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Zusammenfassung nützlicher Techniken von Scrapy in Python
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.
Vollständige Offenlegung der beim maschinellen Lernen verwendeten Methoden
Suchen Sie selbst anhand der Methoden in Djangos Modell
Grundlegende Geschichte der Vererbung in Python (für Anfänger)
Selenium-Screenshot ist nützlich für Screenshots von Webseiten in Python3, Selenium und Google Chrome