Il existe déjà un article précédent, mais pandas a une fonction de visualisation des données. C'est un wrapper fin pour matplotlib, mais il casse un peu le code graphique de base.
Avec la visualisation de l'iris introduite ici, il peut être visualisé avec la même quantité de code que R.
Python for R Users [Différences entre Python et R (visualisation de données / création de graphes)](http://pythondatascience.plavox.info/python%E3%81%A8r%E3%81%AE%E9%81%95%E3%81% 84 /% E3% 83% 87% E3% 83% BC% E3% 82% BF% E5% 8F% AF% E8% A6% 96% E5% 8C% 96% E3% 83% BB% E3% 82% B0 % E3% 83% A9% E3% 83% 95% E4% BD% 9C% E6% 88% 90 /)
La plupart des importations sont des spécifications python, mais je pense que la productivité actuelle de l'analyse des données avec python est assez élevée. R studio / dplyr est devenu populaire dans R, et la productivité s'est améliorée, mais je pense que python a changé depuis 5 ans avec Jupyter / Pandas devenant populaire. (C'est complètement différent de quand numpy + matplotlib était le principal.)
import seaborn as sns
import pandas as pd
iris=sns.load_dataset("iris")
%%matplotlib inline
Importez seaborn pour le rendre à la mode. De plus, seaborn contient également des données sur les jouets, de sorte que l'iris peut être chargé à partir d'ici.
iris.plot.scatter(x="sepal_length",y="sepal_width")
iris.sepal_length.plot.box()
iris.sepal_length.hist()
iris.sepal_length.plot.line()
pd.crosstab(iris.species,columns="species").plot.pie(y="species")
Cela présente certains défis par défaut.
Il est subtil de modifier les paramètres à cet effet, mais si vous ajoutez des paramètres, tout ira bien.
from matplotlib import pylab
default_size=pylab.rcParams["figure.figsize"]
pylab.rcParams["figure.figsize"]=12,12
pd.crosstab(iris.species,columns="species").plot.pie(y="species",colors=sns.color_palette())
Si vous modifiez la taille, remettez-la en place.
pylab.rcParams["figure.figsize"]=default_size
iris.sepal_length.plot.bar()
Étant donné que le graphique à barres suppose des variables catégorielles, il n'a pas éclairci les étiquettes des axes par défaut.
Si vous appelez directement matplotlib, il sera éclairci. (Depuis que seaborn a été importé, la couleur est seaborn.)
from matplotlib import pyplot as plt
plt.bar(iris.index,iris.sepal_length)
La diapositive originale explique Pandas dans la première moitié, mais la visualisation dans la seconde moitié n'utilise pas de Pandas, le code est donc redondant. Si vous voulez faire des choses compliquées, vous devez contacter directement l'API de matplotlib, S'il s'agit d'un diagramme de base, il peut être codé simplement avec l'API Pandas.
Recommended Posts