Der Standard zum Zeichnen von Python-Diagrammen ist "matplotlib", es wurde jedoch darauf hingewiesen, dass es etwas unmodern aussieht und die Notation kompliziert ist. Daher werde ich in diesem Artikel erläutern, wie "Seaborn" verwendet wird, ein Wrapper, mit dem die Funktionen von Matplotlib schöner und einfacher realisiert werden können.
◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html
In dem obigen Artikel werden Matplotlib und Seaborn wie folgt geschrieben.
Über Matplotlib
Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity. You can typically do anything you need using matplotlib but it is not always so easy to figure out.
Über Seaborn
Seaborn is a visualization library based on matplotlib. It seeks to make default data visualizations much more visually appealing. It also has the goal of making more complicated plots simpler to create. It does integrate well with pandas.
Zusamenfassend
matplotlib kann viele Dinge tun, aber es ist kompliziert zu handhaben und Mendo (´ ´ ω ・ `) seaborn basiert auf matplotlib, ist aber schöner und einfacher zu bedienen, daher ist es großartig (; ´∀ `)
Korrekt. (geeignet)
Seaborn installieren (Wenn Sie kein Matplotlib haben, fügen Sie Matplotlib hinzu.)
pip install seaborn
Paketvorbereitung und Datenvorbereitung Seaborn wird standardmäßig mit einigen bekannten Daten geliefert, daher werde ich sie für die Analyse verwenden.
setup.py
import numpy as np
import pandas as pd
import seaborn as sns
x = np.random.normal(size=100) #Erstellen Sie zufällige Daten als Numpy-Array
titanic = sns.load_dataset("titanic") ##Lebens- und Todesdaten der Titanic, berühmt für Kaggle
tips = sns.load_dataset("tips") ##Daten zur Beziehung zwischen der Essenszeit des Restaurants, dem Gesamtabrechnungsbetrag und den Chips
iris = sns.load_dataset("iris") ##Statistische Daten von Ayame, die mit R vertraut sind
In Seaborn können Histogramme mit einer Methode namens "Distplot" erstellt werden.
kde ist eine Zeichenoption für die Dichte-Approximationsfunktion, und bins ist die Spezifikation der Kerbe der x-Achse. Versuchen Sie bei Teppichen, was passiert, wenn Sie True einstellen.
distplot.py
sns.distplot(x, kde=False, rug=False, bins=10)
In Seaborn können Streudiagramme mit einer Methode namens "Joint Plot" gezeichnet werden. Versuchen wir es mit den oben gelesenen Irisdaten.
jointplot.py
sns.jointplot('sepal_width', 'petal_length', data=iris)
Nun, die Verteilung der Werte der x-Achse und der y-Achse ist gleichzeitig im Histogramm zu sehen, was sehr schön ist.
Darüber hinaus ist dieses Streudiagramm für alle in den Daten enthaltenen numerischen Variablen leicht sichtbar. Verwenden Sie eine Methode namens "Pair Plot".
pairplot.py
sns.pairplot(iris)
Sie können sofort sehen, welche Variablen stark korreliert sind.
Es ist auch möglich, kategoriale Variablen farblich zu kennzeichnen. Verwenden Sie die Option Farbton.
Laut weblio http://ejje.weblio.jp/content/hue
[Unzählbare Nase] [Insbesondere [Unzählbare Nase]] ein Schatten, Schatten. Beispiel eine Änderung des Farbtons. b Farbe. Beispiel eine kalte [warme] Farbe kalte [warme] Farbe.
Es scheint, dass das Wort "Farbton" die Bedeutung hat. Es ist das erste Wort, das ich hörte, als ich geboren wurde
pairplot2.py
sns.pairplot(iris, hue="species")
Teil 2 behandelt Barplot, Boxplot, Stripplot usw. http://qiita.com/hik0107/items/7233ca334b2a5e1ca924
Schöne Wärmekarte in Seaborn http://qiita.com/hik0107/items/67ad4cfbc9e84032fc6b
Das gleichzeitige Zeichnen mehrerer Diagramme mit Seaborn ist sehr praktisch http://qiita.com/hik0107/items/865b75ae486728cb0006
Wenn Sie sich für Datenwissenschaftler interessieren, schauen Sie sich zuerst hier um, eine Zusammenfassung der Literatur und Videos http://qiita.com/hik0107/items/ef5e044d2f47940ba712
Es ist Zeit, ernsthaft über die Definition und die Fähigkeiten von Datenwissenschaftlern nachzudenken http://qiita.com/hik0107/items/f9bf14a7575d5c885a16
Recommended Posts