[PYTHON] Ich habe die Grundoperation von Seaborn im Jupyter Lab geschrieben

24 ..

Seaborn

import seaborn as sns
%matplotlib inline
import pandas as pd
df = pd.read_csv('train.csv')
df = df.dropna(subset=['Age'])
sns.distplot(df['Age'])
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcdd7e3d0>

png

sns.set()
sns.distplot(df['Age'],bins=50)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcdd05850>

png

Siehe die Verteilung von zwei Variablen mit sns.jointplot ()

sns.jointplot(x='Age', y='Fare', data=df)
<seaborn.axisgrid.JointGrid at 0x7fcbcdbe31d0>

png

sns.jointplot(x='Age', y='Fare', data=df, kind='hex')
<seaborn.axisgrid.JointGrid at 0x7fcbcdb2b890>

png

(Wichtig) Zeigen Sie mit sns.pairplot () die Verteilung mehrerer Spalten in einer Aufnahme an.

sns.pairplot(df[['Age', 'Fare', 'Pclass', 'Survived']], hue='Survived', kind='scatter', plot_kws={'alpha': 0.5})
/opt/anaconda3/lib/python3.7/site-packages/statsmodels/nonparametric/kde.py:487: RuntimeWarning: invalid value encountered in true_divide
  binned = fast_linbin(X, a, b, gridsize) / (delta * nobs)
/opt/anaconda3/lib/python3.7/site-packages/statsmodels/nonparametric/kdetools.py:34: RuntimeWarning: invalid value encountered in double_scalars
  FAC1 = 2*(np.pi*bw/RANGE)**2





<seaborn.axisgrid.PairGrid at 0x7fcbcda34990>

png

25

sns.barplot () Erstellen Sie ein "Balkendiagramm"

import numpy as np
import pandas as pd
import seaborn as sns
%matplotlib inline
df = pd.read_csv('train.csv')
df.head()
PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S
1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 STON/O2. 3101282 7.9250 NaN S
3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S
4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S
sns.barplot(x='Survived', y='Age', data=df) #Durchschnittswert
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcdd7e390>

png

sns.barplot(x='Survived', y='Age', data=df, estimator=np.median) #Median
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcce3a190>

png

sns.countplot () Vergleichen Sie die Anzahl der Daten

sns.countplot(x='Sex', data=df, hue='Survived')
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbccfb0c10>

png

sns.boxplot () Werte nach Kategorie vergleichen

sns.boxplot(x='Pclass', y='Age', data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbccd82750>

png

sns.boxplot(x='Pclass', y='Age', data=df, hue='Survived')
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcc2a4ed0>

png

sns.violonplot () Visualisiert die Analyse von Daten

sns.violinplot(x='Pclass', y='Age', data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcc1e3ad0>

png

sns.violinplot(x='Pclass', y='Age', data=df, hue=('Survived'))
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcc107210>

png

sns.swarmplot () Sie können die wahre Verteilung sehen

sns.swarmplot(x='Pclass', y='Age', data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcc19a710>

png

sns.swarmplot(x='Pclass', y='Age', data=df, size=4, hue='Survived')
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc6e9fe50>

png

26 ..

Zeichnen Sie eine Heatmap

Stellen Sie eine Korrelation mit df.corr () her

import pandas as pd
df = pd.read_csv('train.csv')
corr = df.corr()
corr
PassengerId Survived Pclass Age SibSp Parch Fare
PassengerId 1.000000 -0.005007 -0.035144 0.036847 -0.057527 -0.001652 0.012658
Survived -0.005007 1.000000 -0.338481 -0.077221 -0.035322 0.081629 0.257307
Pclass -0.035144 -0.338481 1.000000 -0.369226 0.083081 0.018443 -0.549500
Age 0.036847 -0.077221 -0.369226 1.000000 -0.308247 -0.189119 0.096067
SibSp -0.057527 -0.035322 0.083081 -0.308247 1.000000 0.414838 0.159651
Parch -0.001652 0.081629 0.018443 -0.189119 0.414838 1.000000 0.216225
Fare 0.012658 0.257307 -0.549500 0.096067 0.159651 0.216225 1.000000

Plot Heatmap mit sns.heatmap ()

sns.heatmap(corr)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc6df9850>

png

sns.heatmap(corr, cmap='coolwarm', annot=True)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbcd0b3290>

png

Sns.heatmap (), damit Sie Ihre Daten aus der Vogelperspektive sehen können

flights = sns.load_dataset('flights')
print(len(flights))
flights.head()
144
year month passengers
0 1949 January 112
1 1949 February 118
2 1949 March 132
3 1949 April 129
4 1949 May 121
# pivot_Tabelle erstellen
flights_pivot = flights.pivot_table(index='month', columns='year', values='passengers') 
flights_pivot
year 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960
month
January 112 115 145 171 196 204 242 284 315 340 360 417
February 118 126 150 180 196 188 233 277 301 318 342 391
March 132 141 178 193 236 235 267 317 356 362 406 419
April 129 135 163 181 235 227 269 313 348 348 396 461
May 121 125 172 183 229 234 270 318 355 363 420 472
June 135 149 178 218 243 264 315 374 422 435 472 535
July 148 170 199 230 264 302 364 413 465 491 548 622
August 148 170 199 242 272 293 347 405 467 505 559 606
September 136 158 184 209 237 259 312 355 404 404 463 508
October 119 133 162 191 211 229 274 306 347 359 407 461
November 104 114 146 172 180 203 237 271 305 310 362 390
December 118 140 166 194 201 229 278 306 336 337 405 432
sns.heatmap(flights_pivot)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc5baabd0>

png

27 ..

Ändern Sie den Grundstil mit sns.set ()

Geben Sie die Verwendung mit dem Kontextargument an

import pandas as pd
import seaborn as sns
%matplotlib inline

df = pd.read_csv('train.csv')

sns.set(context=('poster'))
df = df.dropna(subset=['Age'])
sns.distplot(df['Age'])
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc568f690>

png

Geben Sie den Stil des gesamten Diagramms mit dem Argument style an

sns.set_style(style='whitegrid') #Hintergrundfarbe ändern
sns.distplot(df['Age'])
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc563d850>

png

Geben Sie die Farbe mit dem Palettenargument an

sns.set(palette='bright')
sns.violinplot(x='Pclass', y='Age', data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc5472850>

png

Löschen Sie Achsen und Frames mit sns.despine ()

sns.set(palette='bright' ,style='ticks') ##style='ticks'Achse zum Zeichnen
sns.violinplot(x='Pclass', y='Age', data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc53ed810>

png

sns.set(palette='bright' )
sns.violinplot(x='Pclass', y='Age', data=df)
sns.despine()

png

Wie bei matplotlib können Sie mit dem plt-Modul verschiedene Dinge tun.

import matplotlib.pyplot as plt
plt.figure(figsize=(10, 5))
sns.distplot(df['Age'])
<matplotlib.axes._subplots.AxesSubplot at 0x7fcbc52d8750>

png

sns.distplot(df['Age'])
plt.savefig('seaborn_sample.png')

png


Recommended Posts

Ich habe die Grundoperation von Seaborn im Jupyter Lab geschrieben
Ich habe die Grundoperation von Numpy im Jupyter Lab geschrieben.
Ich habe die Grundoperation von matplotlib in Jupyter Lab geschrieben
Ich habe die Grundoperation von Pandas im Jupyter Lab geschrieben (Teil 1)
Ich habe die grundlegende Operation von Pandas im Jupyter Lab geschrieben (Teil 2).
Ich habe die grundlegende Grammatik von Python in Jupyter Lab geschrieben
Ich habe die Warteschlange in Python geschrieben
Ich habe den Stack in Python geschrieben
Ich habe den Code geschrieben, um den Brainf * ck-Code in Python zu schreiben
Erstellen Sie eine Ausführungsumgebung für Jupyter Lab
Schriftliche Auswahlsortierung in C.
Ich habe den Gleitflügel in der Schöpfung geschrieben.
Ich habe die Liste der Tastenkombinationen von Jupyter überprüft
Grundlegende Bedienung von Pandas
Grundlegende Bedienung von Pandas
Ich habe versucht, die Grundform von GPLVM zusammenzufassen
[Tipps] Speichern / kopieren Sie das in Jupyter Lab angezeigte Diagramm
[Hinweis] Das installierte Modul kann nicht im Jupiter aufgerufen werden.
Ich habe Python auf Japanisch geschrieben
Ich habe an der Übersetzungsaktivität des offiziellen Django-Dokuments teilgenommen
Überprüfen Sie die Funktionsweise von Python für .NET in jeder Umgebung
Ich möchte Betriebsinformationen über die Yahoo-Route erhalten
Ich habe es in der Sprache Go geschrieben, um das SOLID-Prinzip zu verstehen
Ändern Sie das Thema von Jupyter
Ich schrieb einen Test in "Ich habe versucht, die Wahrscheinlichkeit eines Bingospiels mit Python zu simulieren".
Ich habe ein Skript geschrieben, das das Bild in zwei Teile teilt
Teil 1 Ich habe die Antwort auf das Referenzproblem geschrieben, wie man in Python in Echtzeit offline schreibt
Ich habe die Berechnungszeit des in Python geschriebenen gleitenden Durchschnitts verglichen
Fühlen Sie sich frei, das Legendenlabel mit Seaborn in Python zu ändern
LINEbot-Entwicklung möchte ich den Betrieb in der lokalen Umgebung überprüfen
Ich möchte die Bevölkerung jedes Landes der Welt kennenlernen.
Ich habe mich im Labyrinth verlaufen
Die Geschichte der Teilnahme an AtCoder
Ich habe den Mechanismus der Flaschenanmeldung untersucht!
Ich habe an der ISUCON10-Qualifikationsrunde teilgenommen!
Ich habe Fizz Buzz in Python geschrieben
Über den Grundtyp von Go
Die Geschichte des "Lochs" in der Akte
Ich habe Gray Scale mit Pytorch geschrieben
Beachten Sie, dass ich den Algorithmus des maschinell lernenden Naive Bayes-Klassifikators verstehe. Und ich habe es in Python geschrieben.
[Basic Information Engineer Examination] Ich habe einen Algorithmus für den Maximalwert eines Arrays in Python geschrieben.
[Ich habe den Raspberry Pi (1) berührt] Ich habe die grundlegenden Funktionen der Minecraft Pi Edition (Vorabversion 2015.5.23) zusammengefasst.
Ein leicht verständlicher Vergleich der grundlegenden Grammatik von Python und Go
Ich möchte das Ergebnis von "Zeichenfolge" .split () in Python stapelweise konvertieren
Ich möchte die abstrakte Klasse (ABCmeta) von Python im Detail erklären
Ich möchte eine Liste in der Reihenfolge anderer Listen sortieren
Ich habe einen Korpusleser geschrieben, der die Ergebnisse der MeCab-Analyse liest
Ich möchte einen beliebigen Befehl im Befehlsverlauf von Shell belassen
Ich habe ein Programm erstellt, um die Größe einer Datei mit Python zu überprüfen
Ich habe einen Fehler beim Abrufen der Hierarchie mit MultiIndex von Pandas gemacht
Ich habe versucht, den Höhenwert von DTM in einem Diagramm anzuzeigen
Ich habe versucht, berührungsbezogene Methoden im Szenenmodul von Pythonista zu berühren
Darstellung von Containern in einem verschachtelten Rahmen (schematisch) in Jupyter und was ich bei der Erstellung untersucht habe
Teil 1 Ich habe ein Beispiel für die Antwort auf das Referenzproblem geschrieben, wie man in Python in Echtzeit offline schreibt
Ich habe den Inhalt des Docker-Volumes überprüft
Ich habe den asynchronen Server von Django 3.0 ausprobiert
[Verständnis in 3 Minuten] Der Beginn von Linux