Pour la visualisation de données avec Python et matploblib, essayez déjà pandas + divers traçage de données avec matplotlib et pandas pour essayer rapidement de visualiser l'ensemble de données. , Méthode de visualisation des données par matplotlib (+ pandas), etc. J'ai expliqué.
Cette fois, je vais dessiner une carte thermique, mais avant cela, revoyons la méthode de visualisation.
La visualisation des données fait ici référence à une illustration populaire constituée de tableaux. Un tableau est un format de données qui a plusieurs valeurs d'attribut et une donnée est représentée par une ligne. Il existe de nombreuses variantes, mais voici quelques méthodes de visualisation typiques qui constituent l'axe principal.
Ce graphique convient pour comparer la taille des données. Il existe des variantes telles que le dessin vertical et horizontal, l'empilement et l'organisation de plusieurs séries.
Il s'agit de la valeur par défaut lors de l'utilisation de la fonction plot avec matplotlib. Les données sont dessinées par une ligne reliant les points et une série devient une ligne. En particulier, c'est la meilleure méthode d'expression pour visualiser les modifications des données au fil du temps.
Aussi appelé un graphique en aires. À l'instar du graphique à lignes de pliage, il est facile de suivre les modifications des données de séries chronologiques, mais il est particulièrement adapté pour suivre les modifications des pourcentages et des totaux de données.
Il s'agit d'une bonne méthode de visualisation lorsque l'on examine la corrélation entre deux séries de données. La relation entre les axes X et Y est illustrée à l'emplacement des points de données. Lorsque la relation est claire, il peut être possible de saisir la corrélation en un coup d'œil sans avoir à la calculer.
La carte thermique montre la fréquence principalement par la nuance de couleur, et il est possible de visualiser à quelle position il y a beaucoup de données. Vous pouvez visualiser quelles parties des informations géographiques sont encombrées ou chaudes, et quelles parties du site Web ont le plus de visites et de clics.
Vous pouvez utiliser des cartes thermiques avec la fonction pcolor de matplotlib. La méthode suivante dessine une carte thermique simple en passant une matrice n x m et des étiquettes des axes X et Y en tant que matrice.
#Passez une matrice carrée et une matrice étiquetée X et Y
def draw_heatmap(data, row_labels, column_labels):
#dessiner
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)
ax.set_xticks(np.arange(data.shape[0]) + 0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1]) + 0.5, minor=False)
ax.invert_yaxis()
ax.xaxis.tick_top()
ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()
plt.savefig('image.png')
return heatmap
J'ai essayé de générer des nombres aléatoires de 900 données de 30 x 30. Il est dessiné comme suit.
La nuance de couleur est déterminée par la valeur.
Utilisez ensuite [histgram2d] de NumPy (http://docs.scipy.org/doc/numpy/reference/generated/numpy.histogram2d.html).
Passer un nombre approprié de centaines de tableaux à x et y, respectivement, colorera les points correspondants dans l'image.
def draw_heatmap(x, y):
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.figure()
plt.imshow(heatmap, extent=extent)
plt.show()
plt.savefig('image.png')
La figure ci-dessous est un exemple de génération et de dessin d'environ 500 nombres aléatoires normalement distribués pour X et Y respectivement.
Une carte thermique visualise les données en ajoutant une dimension appelée couleur à un espace bidimensionnel. Cela peut également être utilisé comme une méthode de visualisation puissante en fonction de l'application.
Recommended Posts