Versuchen Sie für die Datenvisualisierung mit Python und matploblib pandas + verschiedene Datenplots mit matplotlib und pandas, um schnell zu versuchen, den Datensatz zu visualisieren. , Datenvisualisierungsmethode von matplotlib (+ pandas) usw. Ich habe erklärt.
Dieses Mal werde ich eine Heatmap zeichnen, aber vorher wollen wir die Visualisierungsmethode noch einmal überprüfen.
Die Datenvisualisierung bezieht sich hier auf eine beliebte Darstellung, die aus Arrays besteht. Ein Array ist ein Datenformat mit mehreren Attributwerten, und ein Datenelement wird durch eine Zeile dargestellt. Es gibt viele Variationen, aber hier sind einige typische Visualisierungsmethoden, die die Hauptachse bilden.
Dieses Diagramm eignet sich zum Vergleichen der Datengröße. Es gibt Variationen wie vertikales und horizontales Zeichnen, Stapeln und Anordnen mehrerer Serien.
Dies ist der Standardwert bei Verwendung der Plotfunktion mit matplotlib. Die Daten werden durch eine Linie gezeichnet, die die Punkte verbindet, und eine Reihe wird zu einer Linie. Insbesondere ist es die beste Ausdrucksmethode zur Visualisierung von Datenänderungen im Zeitverlauf.
Wird auch als Flächendiagramm bezeichnet. Wie das Faltliniendiagramm ist es einfach, Änderungen in Zeitreihendaten zu verfolgen, eignet sich jedoch besonders zum Verfolgen von Änderungen in Datenprozentsätzen und -summen.
Dies ist eine gute Visualisierungsmethode, wenn Sie die Korrelation zwischen zwei Datenreihen betrachten. Die Beziehung zwischen der X- und der Y-Achse ist an der Stelle der Datenpunkte dargestellt. Wenn die Beziehung klar ist, kann es möglich sein, die Korrelation auf einen Blick zu erfassen, ohne sie berechnen zu müssen.
Die Wärmekarte zeigt die Frequenz hauptsächlich durch den Farbton, und es ist möglich zu visualisieren, an welcher Position viele Daten vorhanden sind. Sie können visualisieren, welche Teile der geografischen Informationen überfüllt oder heiß sind und welche Teile der Website die meisten Besuche und Klicks aufweisen.
Sie können Heatmaps mit der pcolor-Funktion von matplotlib verwenden. Die folgende Methode zeichnet eine einfache Heatmap, indem eine n x m-Matrix und Beschriftungen der X- und Y-Achse als Matrix übergeben werden.
#Übergeben Sie eine quadratische Matrix und eine Matrix mit den Bezeichnungen X und Y.
def draw_heatmap(data, row_labels, column_labels):
#zeichnen
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)
ax.set_xticks(np.arange(data.shape[0]) + 0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1]) + 0.5, minor=False)
ax.invert_yaxis()
ax.xaxis.tick_top()
ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()
plt.savefig('image.png')
return heatmap
Ich habe versucht, Zufallszahlen von 900 Daten von 30 x 30 zu generieren. Es wird wie folgt gezeichnet.
Der Farbton wird durch den Wert bestimmt.
Verwenden Sie dann NumPys histgram2d.
Wenn Sie eine geeignete Anzahl von Hunderten von Arrays an x bzw. y übergeben, werden die entsprechenden Punkte im Bild eingefärbt.
def draw_heatmap(x, y):
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.figure()
plt.imshow(heatmap, extent=extent)
plt.show()
plt.savefig('image.png')
Die folgende Abbildung ist ein Beispiel für das Erzeugen und Zeichnen von etwa 500 normalverteilten Zufallszahlen für X bzw. Y.
Eine Heatmap visualisiert Daten, indem einem zweidimensionalen Raum eine Dimension hinzugefügt wird, die als Farbe bezeichnet wird. Dies kann je nach Anwendung auch als leistungsstarke Visualisierungsmethode verwendet werden.
Recommended Posts