Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2

Diagrammzeichnung in Python

Der Standard zum Zeichnen von Python-Diagrammen ist "matplotlib", es wurde jedoch darauf hingewiesen, dass es etwas unmodern aussieht und die Notation kompliziert ist. Daher werde ich in diesem Artikel erläutern, wie "Seaborn" verwendet wird, ein Wrapper, mit dem die Funktionen von Matplotlib schöner und einfacher realisiert werden können.

Bitte beachten Sie den Link unten für Details. In diesem Artikel gehen wir davon aus, dass die Daten von Seaborn, Iris, Tip und Titanic im folgenden Artikel importiert werden.

◆ Wunderschöne Grafikzeichnung mit Python - Verwenden Sie Seaborn, um die Datenanalyse und -visualisierung zu verbessern. Teil 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0

Verteilungsplot

Hier werde ich Tippdaten verwenden. Mal sehen, wie das Kundenkonto (total_bill) für jeden Tag verteilt wird. Verwenden Sie eine Methode namens Stripplot.

stripplot.py


sns.stripplot(x="day", y="total_bill", data=tips)

stripplot.png

Selbst für dieselbe Mahlzeit scheint der Geldbetrag zwischen Frühstück und Abendessen unterschiedlich zu sein, daher habe ich den "Farbton" verwendet, den ich beim letzten Mal verwendet habe. Schauen wir uns Mittag- und Abendessen getrennt an.

stripplot.py


sns.stripplot(x="day", y="total_bill", data=tips, hue='time')

stripplot2.png

Es scheint, dass dieser Laden samstags und sonntags kein Mittagessen hat. Was ist ein Restaurant im Büroviertel? ..

Box Whiskers Plot

Verwenden Sie eine Methode namens Boxplot.

stripplot.py


sns.boxplot(x="size", y="tip", data=tips.sort('size'))

boxplot.png

Hier habe ich die Farbe der Grafikpalette geändert. Der Weg dazu ist so

stripplot.py


flatui = ["#9b59b6", "#3498db", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]

sns.palplot(sns.color_palette(flatui))
sns.set_palette(flatui)

color.png

Bitte überprüfen Sie dies für Details. http://stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html

Balkendiagramm

Hier werde ich versuchen, die Daten von Titanic zu verwenden. Zum Zeichnen des Diagramms wird eine Methode namens Boxplot verwendet.

barplot.py


sns.barplot(x='sex', y='survived', data=titanic, hue='class')

Die x-Achse ist das Geschlecht und die y-Achse ist überlebt, dh eine Datenzeichenfolge, die Einsen und Nullen für Überlebende oder Tote enthält. In diesem Fall gibt es beispielsweise viele Datensätze mit gender = male. Die für die Y-Achse verwendete Zahl ist also der Durchschnittswert jedes Datensatzes. Anschließend wird ein Fehlerbalken aus dem Durchschnittswert hinzugefügt, um die Werte aller Datensätze darzustellen.

Möglicherweise müssen Sie in diesem Bereich etwas vorsichtig sein.

barplot.png

Wenn Sie den Gesamtwert von Survived anstelle des Durchschnittswertes möchten, ist es am besten, ihn mit Pandas zu aggregieren und dann grafisch darzustellen? Vielleicht gibt es andere Möglichkeiten.

barplot2.py


titanic_grpby = titanic.groupby( ['sex', 'class'])
titanic_data_for_graph = titanic_grpby['survived'].aggregate(sum).reset_index()

sns.barplot(x='sex', y='survived', hue= 'class', data=titanic_data_for_graph)

boxplot2.png

Balkendiagramm (Anzahl)

Verwenden Sie Count Count, wenn Sie die der X-Achse entsprechenden Daten vom Wert auf der Y-Achse zählen möchten. Wie beim Histogramm müssen Sie nur die x-Achse definieren.

Die Farbe des Diagramms kann übrigens auch mit der Option Palette angegeben werden.

countplot.py


sns.countplot(x='sex', hue='embarked', data=titanic, palette='Greens_d')

countplot.png

Recommended Posts

Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1
Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
[In-Database Python Analysis-Lernprogramm mit SQL Server 2017] Schritt 3: Erkunden und Visualisieren von Daten
Datenanalyse mit Python 2
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 2 ~ Graph
Einfache gemeinsame Nutzung von Analysen mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 3 - Google Spreadsheets
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 1 - Installation
Versuchen Sie, CloudWatch-Metriken mit der Python-Datenquelle re: dash abzurufen
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Python-Visualisierungstool für die Datenanalyse
Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1
Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2
Datenanalyse mit Python
Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 2 ~ Graph
Holen Sie sich mit Python eine große Menge von Starbas Twitter-Daten und probieren Sie die Datenanalyse Teil 1 aus
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 1 - Installation
Kratzen mit Python und schöner Suppe
Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
Datenpipeline-Aufbau mit Python und Luigi
Visualisierung und Analyse von Stava Twitter-Datenstandortinformationen
Python-Visualisierungstool für die Datenanalyse
FM-Modulation und Demodulation mit Python Part 3
Verarbeiten Sie Pubmed .xml-Daten mit Python [Teil 2]
Erfassung und Visualisierung von Sensordaten für das Pflanzenwachstum mit Intel Edison und Python
Zeichnen Sie Daten einfach in Shell und Python
Tweet-Analyse mit Python, Mecab und CaboCha
FM-Modulation und Demodulation mit Python Part 2
Empfehlung von Altair! Datenvisualisierung mit Python
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Zeichnen Sie ein Diagramm mit PyQtGraph Part 1-Drawing
[Python] Von der morphologischen Analyse von CSV-Daten bis zur CSV-Ausgabe und Diagrammanzeige [GiNZA]
Erstellen Sie solche Testdaten mit Python (Teil 1)
Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib
[Verschiedene Bildanalysen mit Plotly] Dynamische Visualisierung mit Plotly [Python, Bild]
Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib
Verarbeitung und Beurteilung des Datenanalyseplans (Teil 1)
Verarbeitung und Beurteilung des Datenanalyseplans (Teil 2)
Datenanalyse Python
Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt
Erstellen Sie mit Streamlit schnell ein Python-Datenanalyse-Dashboard und stellen Sie es in AWS bereit
Ich habe mit Python verschiedene Dinge ausprobiert: Schaben (Beautiful Soup + Selenium + PhantomJS) und morphologische Analyse
Analyse von Finanzdaten durch Pandas und deren Visualisierung (2)
Datenanalyse zur Verbesserung von POG 1 ~ Web Scraping mit Python ~
Analyse von Finanzdaten durch Pandas und deren Visualisierung (1)
[# 2] Mach Minecraft mit Python. ~ Modellzeichnung und Player-Implementierung ~
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus
Untersuchen Sie den Java- und Python-Datenaustausch mit Apache Arrow
Erstellen Sie mit Python einen Entscheidungsbaum aus 0 und verstehen Sie ihn (3. Datenanalysebibliothek Pandas Edition)
Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ②
Einfache gemeinsame Nutzung von Analysen mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 3 - Google Spreadsheets
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen
Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ①
[Python Seaborn Graph Library] Informationen zur Benutzerwarnung von axes.color_cycle ist veraltet und wird durch axes.prop_cycle ersetzt
[Grafikzeichnung] Ich habe versucht, ein mehrreihiges Balkendiagramm mit Matplotlib und Seaborn zu schreiben
Python-Datenvisualisierungsbibliotheken
Datenanalyse Übersicht Python
Diagrammzeichnung mit Python
Sprachanalyse mit Python
Datenvisualisierung mit Pandas
Python-Datenanalysevorlage
Zeichnen mit Python Tinker