Es gibt bereits einen vorhergehenden Artikel, aber Pandas hat eine Datenvisualisierungsfunktion. Es ist ein dünner Wrapper für matplotlib, aber es bricht den grundlegenden Grafikcode ziemlich stark.
Mit der hier vorgestellten Visualisierung der Iris kann sie mit der gleichen Codemenge wie R visualisiert werden.
Python for R Users [Unterschiede zwischen Python und R (Datenvisualisierung / Diagrammerstellung)](http://pythondatascience.plavox.info/python%E3%81%A8r%E3%81%AE%E9%81%95%E3%81% 84 /% E3% 83% 87% E3% 83% BC% E3% 82% BF% E5% 8F% AF% E8% A6% 96% E5% 8C% 96% E3% 83% BB% E3% 82% B0 % E3% 83% A9% E3% 83% 95% E4% BD% 9C% E6% 88% 90 /)
Die meisten Importe sind Python-Spezifikationen, aber ich bin der Meinung, dass die aktuelle Datenanalyseproduktivität mit Python ziemlich hoch ist. Für R ist Rstudio / dplyr weit verbreitet und die Produktivität hat sich verbessert, aber für Python ist Jupyter / Pandas weit verbreitet, und ich denke, es hat sich seit fünf Jahren geändert. (Es ist völlig anders als damals, als numpy + matplotlib die Hauptrolle spielte.)
import seaborn as sns
import pandas as pd
iris=sns.load_dataset("iris")
%%matplotlib inline
Importieren Sie Seaborn, damit es modisch aussieht. Darüber hinaus enthält seaborn auch Spielzeugdaten, sodass die Iris von hier aus geladen werden kann.
iris.plot.scatter(x="sepal_length",y="sepal_width")
iris.sepal_length.plot.box()
iris.sepal_length.hist()
iris.sepal_length.plot.line()
pd.crosstab(iris.species,columns="species").plot.pie(y="species")
Dies hat standardmäßig einige Herausforderungen.
Es ist subtil, die Einstellungen für diesen Zweck zu ändern, aber wenn Sie Einstellungen hinzufügen, ist dies in Ordnung.
from matplotlib import pylab
default_size=pylab.rcParams["figure.figsize"]
pylab.rcParams["figure.figsize"]=12,12
pd.crosstab(iris.species,columns="species").plot.pie(y="species",colors=sns.color_palette())
Wenn Sie die Größe ändern, legen Sie sie zurück.
pylab.rcParams["figure.figsize"]=default_size
iris.sepal_length.plot.bar()
Da das Balkendiagramm kategoriale Variablen annimmt, wurden die Achsenbeschriftungen standardmäßig nicht dünner.
Wenn Sie matplotlib direkt aufrufen, wird es ausgedünnt. (Da Seaborn importiert wurde, ist die Farbe Seaborn.)
from matplotlib import pyplot as plt
plt.bar(iris.index,iris.sepal_length)
Die ursprüngliche Folie erklärt Pandas in der ersten Hälfte, aber die Visualisierung in der zweiten Hälfte verwendet keine Pandas, sodass der Code redundant ist. Wenn Sie komplizierte Dinge tun möchten, müssen Sie sich direkt an die API von matplotlib wenden. Wenn es sich um ein Basisdiagramm handelt, kann es einfach mit der Pandas-API codiert werden.
Recommended Posts