Visualisation des données avec Python - dessinons une carte de chaleur fraîche

Dessin graphique en Python

La norme pour dessiner des graphiques Python est "matplotlib", mais cela semble un peu démodé. La complexité de la notation a été soulignée.

Par conséquent, dans cet article, je vais discuter de la façon d'utiliser "Seaborn", qui est un wrapper pour réaliser les fonctions de Matplotlib plus magnifiquement et plus facilement. Voir les liens ci-dessous pour plus d'informations sur Seaborn et comment l'utiliser de manière rudimentaire.

◆ Beau dessin graphique avec python - Utilisez seaborn pour améliorer l'analyse et la visualisation des données Partie 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0

Carte de chaleur

Chez seaborn, vous pouvez dessiner une belle carte thermique comme indiqué ci-dessous. (Extrait du site du tutoriel de Seaborn)

Cela a également un impact sur l'apparence, et c'est utile pour les personnes qui ne sont pas très bonnes en chiffres parce que c'est bon pour les gens. Je pense qu'il vaut la peine de se rappeler comment l'utiliser.

image

Référence) http://stanford.edu/~mwaskom/software/seaborn/examples/many_pairwise_correlations.html

manière

Expliquons comment le faire. Importez les bibliothèques suivantes dont vous avez besoin

prepare.py


import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

Préparez les données et convertissez-les dans un format lisible. Seaborn est livré avec certains ensembles de données par défaut, alors utilisons-le. Cette fois, j'utiliserai les données appelées "vols"

data.py


df_flights = sns.load_dataset('flights')
df_flights.head(5)

Si vous regardez la tête, vous pouvez voir que les données sont étendues verticalement pour l'année et le mois.

data.py


	year	month	    passengers
0	1949	January	    112
1	1949	February    118
2	1949	March	    132
3	1949	April	    129
4	1949	May         121

Disons que vous êtes intéressé par les tendances des passagers sur les deux axes de l'année et du mois. En d'autres termes, je vais dessiner une carte thermique pour x-année et y-mois.

La carte thermique peut être dessinée avec une fonction appelée sns.heatmap, mais il est nécessaire de concevoir les données à consommer. Vous devez le convertir au format Pivot, qui a l'axe que vous souhaitez amener à x dans l'index et l'axe que vous souhaitez amener à y dans la colonne.

data.py


df_flights_pivot = pd.pivot_table(data=df_flights, values='passengers', 
                                  columns='year', index='month', aggfunc=np.mean)

Si vous n'êtes pas familiarisé avec le traitement des données avec Python Pandas, veuillez vous référer à ce qui suit.

Référence: Traitement des données par Python

Un résumé rudimentaire de la manipulation des données dans Python Pandas - premier semestre et second semestre http://qiita.com/hik0107/items/d991cc44c2d1778bb82e http://qiita.com/hik0107/items/0ae69131e5317b62c3b7

Il ne vous reste plus qu'à donner à seaborn un dataframe au format Pivot.

draw.py


sns.heatmap(df_flights_pivot)

Un chiffre comme celui-ci s'affiche. Le nombre de passagers a augmenté d'année en année depuis 1949, en particulier vers juillet-août. Vous pouvez voir que le nombre de passagers est particulièrement important d'un seul coup. Aussi, il semble que le nombre de clients s'installera un peu chaque année en novembre et augmentera à nouveau en décembre.

image

Un peu plus de maquillage

Vous pouvez laisser la figure ci-dessus telle quelle, mais appliquons du maquillage pour changer un peu plus l'apparence. Par exemple, cela ressemble à ceci

draw.py


plt.figure(figsize=(12, 9))
sns.heatmap(df_flights_pivot, annot=True, fmt='g', cmap='Blues')

annot est l'argument qui écrit le nombre dans la cellule, fmt est l'ajustement du chiffre du nombre, cmap est Color_map, Spécifie une palette de couleurs de dégradé.

Ça ressemble à ça. C'est mieux lorsque vous souhaitez discuter tout en regardant des valeurs numériques spécifiques.

image

Cet article aussi

Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0

Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 2 http://qiita.com/hik0107/items/7233ca334b2a5e1ca924

Si vous êtes intéressé par les data scientists, regardez d'abord ici, un résumé de la littérature et des vidéos http://qiita.com/hik0107/items/ef5e044d2f47940ba712

Recommended Posts

Visualisation des données avec Python - dessinons une carte de chaleur fraîche
Visualisation en temps réel des données thermographiques AMG8833 en Python
Bibliothèques de visualisation de données Python
Échantillonnage dans des données déséquilibrées
Visualisation des données avec les pandas
Gérer les données ambiantes en Python
Manipuler des données en Python-essayez avec Pandas_plyr
Afficher les données UTM-30LX en Python
Écrire des données au format HDF
Visualisation des données par préfecture
Application Python: visualisation de données, partie 2: matplotlib
Méthode de visualisation de données utilisant matplotlib (1)
Méthode de visualisation de données utilisant matplotlib (2)