[PYTHON] Die Geschichte, dass die neue Zeichnungsbibliothek "HiPlot" ziemlich gut war

Einführung

Vor ein paar Tagen Facebook-Forschung namens HiPlot Eine neue Datenzeichnungsbibliothek wurde angekündigt.

https://github.com/facebookresearch/hiplot

Wie wäre es mit gits ReadMe, weil es einfach war? Ich dachte, Als ich es tatsächlich benutzte, fühlte ich die Zukunft, also werde ich es teilen.

Charakteristisch

HiPlot ist ein Zeichenwerkzeug, das sich auf das Erkennen von Datenkorrelationen und -mustern spezialisiert hat. Ich bin mir nicht sicher, also schau dir bitte das nächste Video an.

titanic_hiplot2.gif

Auf diese Weise werden nicht nur die Daten gezeichnet Sie können Daten interaktiv auswählen, filtern und ausschließen.

Es gibt ein Beispiel, das im offiziellen Dokument verschoben werden kann. Bitte berühren Sie es.

Offizielles Dokument

Wie benutzt man

Sie können es von pip installieren.

pip install hiplot

Um es zu verwenden, übergeben Sie einfach die Daten des Wörterbuchtyps oder den CSV-Dateipfad an HiPlot.

import pandas as pd
import hiplot as hip

#Pandas → Wörterbuch → HiPlot
train = pd.read_csv('../input/titanic/train.csv')

# orient='records'Muss übergeben werden.
import_dict = train.to_dict(orient='records')
dict_hip = hip.Experiment.from_iterable(import_dict)
dict_hip.display()

#Direkt von csv
csv_hip = hip.Experiment.from_csv('../input/titanic/train.csv')
csv_hip.display()

Das erstellte Diagramm kann auch als HTML gespeichert werden.

dict_hip.to_html()

guter Punkt

Intuitiv und einfach zu bedienen, nicht nur für die erste Datenanalyse Ich denke, es kann in verschiedenen Aspekten verwendet werden, z. B. beim Einstellen von Hyperparametern während des Lernens.

Da es extrem leicht ist, kann es auch ohne Stress verwendet werden.

Subtile Punkte

Ich habe den Eindruck, dass die Funktionen noch nicht vollständig sind, wahrscheinlich weil sie gerade veröffentlicht wurden. Dies ist etwas problematisch, da keine Funktion zum Zurückkehren zum vorherigen Vorgang vorhanden ist.

Am Ende

Es ist immer noch ein neues Werkzeug, daher habe ich den Eindruck, dass es funktionell fehlt. Ich denke, es ist ein nützliches Werkzeug.

Wenn Sie EDA mit Kaggle machen, warum nicht zuerst in diese Bibliothek eintauchen?

Recommended Posts

Die Geschichte, dass die neue Zeichnungsbibliothek "HiPlot" ziemlich gut war
Die Geschichte, dass XGBoost endlich installiert wurde
Die Geschichte, dass der Rückgabewert von tape.gradient () None war
Die Geschichte, die Japan ausgab, wurde mit Django verwechselt
Die Geschichte, dass meine Pull-Anfrage in Scipy aufgenommen wurde
Die Geschichte, dass die Version von Python 3.7.7 nicht an Heroku angepasst wurde
Die Geschichte, dass der Wachmann eingesperrt war, als das Labor auf IoT umgestellt wurde
Die Geschichte, dass die asynchrone API, die API-Gateway- und Schrittfunktionen kombinierte, die stärkste war
Die Geschichte, mit der ich mich befasst habe, weil Apache bei AH00144 war
Die Geschichte, dass FastAPI die Vormachtstellung übernehmen könnte
Die Geschichte, die scipy plötzlich aufhörte zu laden
Die Geschichte von Django, wie er eine Bibliothek erstellt, die vielleicht etwas nützlicher ist