Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1

Diagrammzeichnung in Python

Der Standard zum Zeichnen von Python-Diagrammen ist "matplotlib", es wurde jedoch darauf hingewiesen, dass es etwas unmodern aussieht und die Notation kompliziert ist. Daher werde ich in diesem Artikel erläutern, wie "Seaborn" verwendet wird, ein Wrapper, mit dem die Funktionen von Matplotlib schöner und einfacher realisiert werden können.

◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html

In dem obigen Artikel werden Matplotlib und Seaborn wie folgt geschrieben.

Über Matplotlib

Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity. You can typically do anything you need using matplotlib but it is not always so easy to figure out.

Über Seaborn

Seaborn is a visualization library based on matplotlib. It seeks to make default data visualizations much more visually appealing. It also has the goal of making more complicated plots simpler to create. It does integrate well with pandas.

Zusamenfassend

matplotlib kann viele Dinge tun, aber es ist kompliziert zu handhaben und Mendo (´ ´ ω ・ `) seaborn basiert auf matplotlib, ist aber schöner und einfacher zu bedienen, daher ist es großartig (; ´∀ `)

Korrekt. (geeignet)

Rahmen

Seaborn installieren (Wenn Sie kein Matplotlib haben, fügen Sie Matplotlib hinzu.)

pip install seaborn

Paketvorbereitung und Datenvorbereitung Seaborn wird standardmäßig mit einigen bekannten Daten geliefert, daher werde ich sie für die Analyse verwenden.

setup.py


import numpy as np
import pandas as pd
import seaborn as sns

x = np.random.normal(size=100) #Erstellen Sie zufällige Daten als Numpy-Array

titanic = sns.load_dataset("titanic") ##Lebens- und Todesdaten der Titanic, berühmt für Kaggle
tips = sns.load_dataset("tips")  ##Daten zur Beziehung zwischen der Essenszeit des Restaurants, dem Gesamtabrechnungsbetrag und den Chips
iris = sns.load_dataset("iris")  ##Statistische Daten von Ayame, die mit R vertraut sind

Histogramm

In Seaborn können Histogramme mit einer Methode namens "Distplot" erstellt werden.

kde ist eine Zeichenoption für die Dichte-Approximationsfunktion, und bins ist die Spezifikation der Kerbe der x-Achse. Versuchen Sie bei Teppichen, was passiert, wenn Sie True einstellen.

distplot.py


sns.distplot(x, kde=False, rug=False, bins=10) 

distplot.png

Streudiagramm

In Seaborn können Streudiagramme mit einer Methode namens "Joint Plot" gezeichnet werden. Versuchen wir es mit den oben gelesenen Irisdaten.

jointplot.py


sns.jointplot('sepal_width', 'petal_length', data=iris)

Nun, die Verteilung der Werte der x-Achse und der y-Achse ist gleichzeitig im Histogramm zu sehen, was sehr schön ist.

jointplot.png

Scatter Map Festival

Darüber hinaus ist dieses Streudiagramm für alle in den Daten enthaltenen numerischen Variablen leicht sichtbar. Verwenden Sie eine Methode namens "Pair Plot".

pairplot.py


sns.pairplot(iris)

Sie können sofort sehen, welche Variablen stark korreliert sind.

pairplot.png

Es ist auch möglich, kategoriale Variablen farblich zu kennzeichnen. Verwenden Sie die Option Farbton.

Laut weblio http://ejje.weblio.jp/content/hue

[Unzählbare Nase] [Insbesondere [Unzählbare Nase]] ein Schatten, Schatten. Beispiel eine Änderung des Farbtons. b Farbe. Beispiel eine kalte [warme] Farbe kalte [warme] Farbe.

Es scheint, dass das Wort "Farbton" die Bedeutung hat. Es ist das erste Wort, das ich hörte, als ich geboren wurde

pairplot2.py


sns.pairplot(iris, hue="species")

pairplot2.png

Fahren Sie mit Teil 2 fort

Teil 2 behandelt Barplot, Boxplot, Stripplot usw. http://qiita.com/hik0107/items/7233ca334b2a5e1ca924

Schöne Wärmekarte in Seaborn http://qiita.com/hik0107/items/67ad4cfbc9e84032fc6b

Das gleichzeitige Zeichnen mehrerer Diagramme mit Seaborn ist sehr praktisch http://qiita.com/hik0107/items/865b75ae486728cb0006

Andere Artikel

Wenn Sie sich für Datenwissenschaftler interessieren, schauen Sie sich zuerst hier um, eine Zusammenfassung der Literatur und Videos http://qiita.com/hik0107/items/ef5e044d2f47940ba712

Es ist Zeit, ernsthaft über die Definition und die Fähigkeiten von Datenwissenschaftlern nachzudenken http://qiita.com/hik0107/items/f9bf14a7575d5c885a16

Recommended Posts

Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1
Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
[In-Database Python Analysis-Lernprogramm mit SQL Server 2017] Schritt 3: Erkunden und Visualisieren von Daten
Datenanalyse mit Python 2
Datenanalyse mit Python
Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 2 ~ Graph
Holen Sie sich mit Python eine große Menge von Starbas Twitter-Daten und probieren Sie die Datenanalyse Teil 1 aus
Einfache Analyse und gemeinsame Nutzung mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 1 - Installation
Kratzen mit Python und schöner Suppe
Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
Visualisierung und Analyse von Stava Twitter-Datenstandortinformationen
Anwendung von Python: Datenvisualisierung Teil 3: Verschiedene Grafiken
Python-Visualisierungstool für die Datenanalyse
FM-Modulation und Demodulation mit Python Part 3
Verarbeiten Sie Pubmed .xml-Daten mit Python [Teil 2]
Erfassung und Visualisierung von Sensordaten für das Pflanzenwachstum mit Intel Edison und Python
Zeichnen Sie Daten einfach in Shell und Python
Tweet-Analyse mit Python, Mecab und CaboCha
FM-Modulation und Demodulation mit Python Part 2
Empfehlung von Altair! Datenvisualisierung mit Python
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Zeichnen Sie ein Diagramm mit PyQtGraph Part 1-Drawing
[Python] Von der morphologischen Analyse von CSV-Daten bis zur CSV-Ausgabe und Diagrammanzeige [GiNZA]
Erstellen Sie solche Testdaten mit Python (Teil 1)
Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib
[Verschiedene Bildanalysen mit Plotly] Dynamische Visualisierung mit Plotly [Python, Bild]
Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib
Verarbeitung und Beurteilung des Datenanalyseplans (Teil 1)
Verarbeitung und Beurteilung des Datenanalyseplans (Teil 2)
Datenanalyse Python
Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt
Erstellen Sie mit Streamlit schnell ein Python-Datenanalyse-Dashboard und stellen Sie es in AWS bereit
Ich habe mit Python verschiedene Dinge ausprobiert: Schaben (Beautiful Soup + Selenium + PhantomJS) und morphologische Analyse
Analyse von Finanzdaten durch Pandas und deren Visualisierung (1)
[# 2] Mach Minecraft mit Python. ~ Modellzeichnung und Player-Implementierung ~
Lesehinweis: Einführung in die Datenanalyse mit Python
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus
Untersuchen Sie den Java- und Python-Datenaustausch mit Apache Arrow
Einfache gemeinsame Nutzung von Analysen mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 4 ~ Pivot-Tabelle
Erstellen Sie mit Python einen Entscheidungsbaum aus 0 und verstehen Sie ihn (3. Datenanalysebibliothek Pandas Edition)
Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ②
Einfache gemeinsame Nutzung von Analysen mit re: dash, einem Open-Source-Tool zur Datenvisualisierung Teil 3 - Google Spreadsheets
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen
Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ①
[Python Seaborn Graph Library] Informationen zur Benutzerwarnung von axes.color_cycle ist veraltet und wird durch axes.prop_cycle ersetzt
[Grafikzeichnung] Ich habe versucht, ein mehrreihiges Balkendiagramm mit Matplotlib und Seaborn zu schreiben
Python-Datenvisualisierungsbibliotheken
Datenanalyse Übersicht Python
Diagrammzeichnung mit Python
Sprachanalyse mit Python
Datenvisualisierung mit Pandas
Python-Datenanalysevorlage
Zeichnen mit Python Tinker
Sprachanalyse mit Python