[PYTHON] Datenvisualisierung mit Pandas

Es gibt bereits einen vorhergehenden Artikel, aber Pandas hat eine Datenvisualisierungsfunktion. Es ist ein dünner Wrapper für matplotlib, aber es bricht den grundlegenden Grafikcode ziemlich stark.

Datenvisualisierung mit Pandas

Mit der hier vorgestellten Visualisierung der Iris kann sie mit der gleichen Codemenge wie R visualisiert werden.

Python for R Users [Unterschiede zwischen Python und R (Datenvisualisierung / Diagrammerstellung)](http://pythondatascience.plavox.info/python%E3%81%A8r%E3%81%AE%E9%81%95%E3%81% 84 /% E3% 83% 87% E3% 83% BC% E3% 82% BF% E5% 8F% AF% E8% A6% 96% E5% 8C% 96% E3% 83% BB% E3% 82% B0 % E3% 83% A9% E3% 83% 95% E4% BD% 9C% E6% 88% 90 /)

Die meisten Importe sind Python-Spezifikationen, aber ich bin der Meinung, dass die aktuelle Datenanalyseproduktivität mit Python ziemlich hoch ist. Für R ist Rstudio / dplyr weit verbreitet und die Produktivität hat sich verbessert, aber für Python ist Jupyter / Pandas weit verbreitet, und ich denke, es hat sich seit fünf Jahren geändert. (Es ist völlig anders als damals, als numpy + matplotlib die Hauptrolle spielte.)

Erforderliche Pakete, Daten laden

import seaborn as sns
import pandas as pd
iris=sns.load_dataset("iris")
%%matplotlib inline

Importieren Sie Seaborn, damit es modisch aussieht. Darüber hinaus enthält seaborn auch Spielzeugdaten, sodass die Iris von hier aus geladen werden kann.

Streudiagramm

iris.plot.scatter(x="sepal_length",y="sepal_width")

scatter.png

Box Whisker

iris.sepal_length.plot.box()

box.png

Histogramm

iris.sepal_length.hist()

hist.png

Liniendiagramm

iris.sepal_length.plot.line()

line.png

Kuchendiagramm

pd.crosstab(iris.species,columns="species").plot.pie(y="species")

pie.png

Dies hat standardmäßig einige Herausforderungen.

Es ist subtil, die Einstellungen für diesen Zweck zu ändern, aber wenn Sie Einstellungen hinzufügen, ist dies in Ordnung.

from matplotlib import pylab
default_size=pylab.rcParams["figure.figsize"]
pylab.rcParams["figure.figsize"]=12,12
pd.crosstab(iris.species,columns="species").plot.pie(y="species",colors=sns.color_palette())

pie2.png

Wenn Sie die Größe ändern, legen Sie sie zurück.

pylab.rcParams["figure.figsize"]=default_size

Balkendiagramm

iris.sepal_length.plot.bar()

bar.png

Da das Balkendiagramm kategoriale Variablen annimmt, wurden die Achsenbeschriftungen standardmäßig nicht dünner.

Wenn Sie matplotlib direkt aufrufen, wird es ausgedünnt. (Da Seaborn importiert wurde, ist die Farbe Seaborn.)

from matplotlib import pyplot as plt
plt.bar(iris.index,iris.sepal_length)

bar2.png

Zusammenfassung

Die ursprüngliche Folie erklärt Pandas in der ersten Hälfte, aber die Visualisierung in der zweiten Hälfte verwendet keine Pandas, sodass der Code redundant ist. Wenn Sie komplizierte Dinge tun möchten, müssen Sie sich direkt an die API von matplotlib wenden. Wenn es sich um ein Basisdiagramm handelt, kann es einfach mit der Pandas-API codiert werden.

Recommended Posts

Datenvisualisierung mit Pandas
Datenmanipulation mit Pandas!
Daten mit Pandas mischen
Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib
Datenverarbeitungstipps mit Pandas
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)
Vielseitige Datenerfassung mit Pandas + Matplotlib
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (3)
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (4)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Implementieren Sie "Data Visualization Design # 2" mit matplotlib
Pandas Daten lesen
Versuchen Sie, mit Pandas in ordentliche Daten umzuwandeln
Empfehlung von Altair! Datenvisualisierung mit Python
Behandeln Sie 3D-Datenstrukturen mit Pandas
Beispiel für eine effiziente Datenverarbeitung mit PANDAS
Best Practices für den Umgang mit Daten mit Pandas
Datenanalyse mit Python 2
Mit Pandas schnell visualisieren
Versuchen Sie, Doujin-Musikdaten mit Pandas zu aggregieren
Datensätze mit Pandas verarbeiten (1)
Bootstrap-Sampling mit Pandas
Konvertieren Sie 202003 bis 2020-03 mit Pandas
Datensätze mit Pandas verarbeiten (2)
Python-Datenvisualisierungsbibliotheken
Zusammenführen von Datensätzen mit Pandas
Daten mit TensorFlow lesen
Datenerweiterung mit openCV
Machen Sie Urlaubsdaten mit Pandas zu einem Datenrahmen
Daten mit Scipy normieren
Datenanalyse mit Python
Visualisierung der Logistik mit Python
LADEN SIE DATEN mit PyMysql
Analyse von Finanzdaten durch Pandas und deren Visualisierung (2)
So konvertieren Sie horizontal gehaltene Daten mit Pandas in vertikal gehaltene Daten
Seien Sie vorsichtig beim Lesen von Daten mit Pandas (geben Sie dtype an)
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung
So extrahieren Sie mit Pandas Daten, denen der Wert nan nicht fehlt
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
So extrahieren Sie mit Pandas Daten, denen der Wert nan nicht fehlt
Mit Python erstellte Beispieldaten
Betten Sie Audiodaten in Jupyter ein
Zeichnen Sie Excel-Daten mit matplotlib (1)
Laden Sie verschachtelten Json mit Pandas
Künstliche Datengenerierung mit Numpy
Extrahieren Sie Twitter-Daten mit CSV
Holen Sie sich Youtube-Daten mit Python
Lernen Sie neue Daten mit PaintsChainer
Visualisierung von Daten nach Präfektur
Binarisieren Sie Fotodaten mit OpenCV
[Python] Ändere den Typ mit Pandas
Zeichnen Sie Excel-Daten mit matplotlib (2)
Python-Anwendung: Datenvisualisierung # 2: matplotlib
Verwenden Sie Django, um Tweet-Daten zu speichern
Standardisieren Sie nach Gruppen mit Pandas
Datenvisualisierungsmethode mit Matplotlib (2)