Der Standard zum Zeichnen von Python-Diagrammen ist "matplotlib", sieht aber etwas unmodern aus. Auf die Komplexität der Notation wurde hingewiesen.
Daher werde ich in diesem Artikel erläutern, wie "Seaborn" verwendet wird, ein Wrapper, mit dem die Funktionen von Matplotlib schöner und einfacher realisiert werden können. Unter den folgenden Links finden Sie weitere Informationen zu Seaborn und dessen rudimentäre Verwendung.
◆ Wunderschöne Grafikzeichnung mit Python - Verwenden Sie Seaborn, um die Datenanalyse und -visualisierung zu verbessern. Teil 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0
In diesem Artikel werde ich erklären, wie aus den Daten mehrere Diagramme mit unterschiedlichen Attributen gleichzeitig gezeichnet werden. Zum Beispiel das Bild unten. Die Beziehung zwischen x-Schritt und y-Position wird für jedes Attribut namens "Walk" sofort grafisch dargestellt.
Referenz) http://stanford.edu/~mwaskom/software/seaborn/examples/many_facets.html
Es ist eine sehr bequeme Technik, weil ich sie oft in der Datenanalysepraxis verwenden möchte. ・ Ich möchte den Unterschied für jedes "Kundensegment" sehen. ・ Ich möchte die Umsatztrends für jeden "Geschäftsbereich" sehen. ・ Ich möchte Änderungen in den Kundentrends nach "Region" sehen.
Es gibt viele mögliche Nutzungssituationen.
『Facet』 Diese Methode, jedes Attribut gleichzeitig grafisch darzustellen, wird als "Facette" bezeichnet. Selbst bei Seegeborenen wird es als Funktion namens "Facetgrid" implementiert. Das bekannte Grafikzeichnungspaket "ggplot" von R und Python hat auch eine Funktion namens "Facet".
Lassen Sie uns erklären, wie es geht. Importieren Sie die folgenden Bibliotheken, die Sie benötigen
prepare.py
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
Bereiten Sie die Daten vor. Seaborn wird standardmäßig mit einigen Datensätzen geliefert. Verwenden wir das also. Dieses Mal werde ich die Daten verwenden, die "Flüge" genannt werden.
data.py
df_flights = sns.load_dataset('flights')
df_flights.head(5)
Wenn Sie sich den Kopf ansehen, sehen Sie, dass die Daten für Jahr und Monat vertikal erweitert werden. Zusätzlich ist ersichtlich, dass der numerische Wert Daten sind, die den Übergang der Anzahl von Passagieren zeigen.
data.py
year month passengers
0 1949 January 112
1 1949 February 118
2 1949 March 132
3 1949 April 129
4 1949 May 121
Es gibt auch eine Heatmap-Analyse mit denselben Daten. http://qiita.com/hik0107/items/67ad4cfbc9e84032fc6b
Führen Sie als Nächstes die Zeichnung wie folgt aus.
draw.py
grid = sns.FacetGrid(df_flights, col="year", hue="year", col_wrap=4, size=5)
grid.map(sns.pointplot, 'month', 'passengers')
Definieren Sie in sns.FacetGrid zunächst, wie viele Diagramme in welcher Art von Division gezeichnet werden sollen. Dieses Mal erkläre ich, dass ich für jedes Attribut von 'Jahr' in den Daten mit dem Namen df_flights ein Diagramm zeichnen werde. (col = 'Jahr' Teil)
Das Jahr ist für 12 Jahre (12 Typen) und wird in 4x3 Quadraten mit col_wrap = 4 gezeichnet. hue = 'year' ist eine Option, um die Farbe modisch zu machen. Es ist egal, ob Sie es nicht haben.
Das Ausführungsergebnis ist wie folgt.
Die Zahl der Passagiere steigt von Jahr zu Jahr und die Hochsaison von Juli bis August wird allmählich sichtbar. Du kannst es sehen.
Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0
Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2 http://qiita.com/hik0107/items/7233ca334b2a5e1ca924
Wenn Sie sich für Datenwissenschaftler interessieren, schauen Sie sich zuerst hier um, eine Zusammenfassung der Literatur und Videos http://qiita.com/hik0107/items/ef5e044d2f47940ba712
Recommended Posts