Vor ein paar Tagen Facebook-Forschung namens HiPlot Eine neue Datenzeichnungsbibliothek wurde angekündigt.
https://github.com/facebookresearch/hiplot
Wie wäre es mit gits ReadMe, weil es einfach war? Ich dachte, Als ich es tatsächlich benutzte, fühlte ich die Zukunft, also werde ich es teilen.
HiPlot ist ein Zeichenwerkzeug, das sich auf das Erkennen von Datenkorrelationen und -mustern spezialisiert hat. Ich bin mir nicht sicher, also schau dir bitte das nächste Video an.
Auf diese Weise werden nicht nur die Daten gezeichnet Sie können Daten interaktiv auswählen, filtern und ausschließen.
Es gibt ein Beispiel, das im offiziellen Dokument verschoben werden kann. Bitte berühren Sie es.
Sie können es von pip installieren.
pip install hiplot
Um es zu verwenden, übergeben Sie einfach die Daten des Wörterbuchtyps oder den CSV-Dateipfad an HiPlot.
import pandas as pd
import hiplot as hip
#Pandas → Wörterbuch → HiPlot
train = pd.read_csv('../input/titanic/train.csv')
# orient='records'Muss übergeben werden.
import_dict = train.to_dict(orient='records')
dict_hip = hip.Experiment.from_iterable(import_dict)
dict_hip.display()
#Direkt von csv
csv_hip = hip.Experiment.from_csv('../input/titanic/train.csv')
csv_hip.display()
Das erstellte Diagramm kann auch als HTML gespeichert werden.
dict_hip.to_html()
Intuitiv und einfach zu bedienen, nicht nur für die erste Datenanalyse Ich denke, es kann in verschiedenen Aspekten verwendet werden, z. B. beim Einstellen von Hyperparametern während des Lernens.
Da es extrem leicht ist, kann es auch ohne Stress verwendet werden.
Ich habe den Eindruck, dass die Funktionen noch nicht vollständig sind, wahrscheinlich weil sie gerade veröffentlicht wurden. Dies ist etwas problematisch, da keine Funktion zum Zurückkehren zum vorherigen Vorgang vorhanden ist.
Es ist immer noch ein neues Werkzeug, daher habe ich den Eindruck, dass es funktionell fehlt. Ich denke, es ist ein nützliches Werkzeug.
Wenn Sie EDA mit Kaggle machen, warum nicht zuerst in diese Bibliothek eintauchen?
Recommended Posts