Der Standard zum Zeichnen von Python-Diagrammen ist "matplotlib", es wurde jedoch darauf hingewiesen, dass es etwas unmodern aussieht und die Notation kompliziert ist. Daher werde ich in diesem Artikel erläutern, wie "Seaborn" verwendet wird, ein Wrapper, mit dem die Funktionen von Matplotlib schöner und einfacher realisiert werden können.
Bitte beachten Sie den Link unten für Details. In diesem Artikel gehen wir davon aus, dass die Daten von Seaborn, Iris, Tip und Titanic im folgenden Artikel importiert werden.
◆ Wunderschöne Grafikzeichnung mit Python - Verwenden Sie Seaborn, um die Datenanalyse und -visualisierung zu verbessern. Teil 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0
Hier werde ich Tippdaten verwenden. Mal sehen, wie das Kundenkonto (total_bill) für jeden Tag verteilt wird. Verwenden Sie eine Methode namens Stripplot.
stripplot.py
sns.stripplot(x="day", y="total_bill", data=tips)
Selbst für dieselbe Mahlzeit scheint der Geldbetrag zwischen Frühstück und Abendessen unterschiedlich zu sein, daher habe ich den "Farbton" verwendet, den ich beim letzten Mal verwendet habe. Schauen wir uns Mittag- und Abendessen getrennt an.
stripplot.py
sns.stripplot(x="day", y="total_bill", data=tips, hue='time')
Es scheint, dass dieser Laden samstags und sonntags kein Mittagessen hat. Was ist ein Restaurant im Büroviertel? ..
Verwenden Sie eine Methode namens Boxplot.
stripplot.py
sns.boxplot(x="size", y="tip", data=tips.sort('size'))
Hier habe ich die Farbe der Grafikpalette geändert. Der Weg dazu ist so
stripplot.py
flatui = ["#9b59b6", "#3498db", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]
sns.palplot(sns.color_palette(flatui))
sns.set_palette(flatui)
Bitte überprüfen Sie dies für Details. http://stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html
Hier werde ich versuchen, die Daten von Titanic zu verwenden. Zum Zeichnen des Diagramms wird eine Methode namens Boxplot verwendet.
barplot.py
sns.barplot(x='sex', y='survived', data=titanic, hue='class')
Die x-Achse ist das Geschlecht und die y-Achse ist überlebt, dh eine Datenzeichenfolge, die Einsen und Nullen für Überlebende oder Tote enthält. In diesem Fall gibt es beispielsweise viele Datensätze mit gender = male. Die für die Y-Achse verwendete Zahl ist also der Durchschnittswert jedes Datensatzes. Anschließend wird ein Fehlerbalken aus dem Durchschnittswert hinzugefügt, um die Werte aller Datensätze darzustellen.
Möglicherweise müssen Sie in diesem Bereich etwas vorsichtig sein.
Wenn Sie den Gesamtwert von Survived anstelle des Durchschnittswertes möchten, ist es am besten, ihn mit Pandas zu aggregieren und dann grafisch darzustellen? Vielleicht gibt es andere Möglichkeiten.
barplot2.py
titanic_grpby = titanic.groupby( ['sex', 'class'])
titanic_data_for_graph = titanic_grpby['survived'].aggregate(sum).reset_index()
sns.barplot(x='sex', y='survived', hue= 'class', data=titanic_data_for_graph)
Verwenden Sie Count Count, wenn Sie die der X-Achse entsprechenden Daten vom Wert auf der Y-Achse zählen möchten. Wie beim Histogramm müssen Sie nur die x-Achse definieren.
Die Farbe des Diagramms kann übrigens auch mit der Option Palette angegeben werden.
countplot.py
sns.countplot(x='sex', hue='embarked', data=titanic, palette='Greens_d')
Recommended Posts