Verwendung von Matplotlib zum Anzeigen von Histogrammen und Streudiagrammen auf Jupyter Notebook.
Der Inhalt dieses Artikels wird in der Jupyter Notebook-Umgebung getestet, die gemäß dem folgenden Artikel erstellt wurde. Einfache Installation und Inbetriebnahme von Jupyter Notebook mit Docker (unterstützt auch nbextensions und Scala) --Qiita
In dieser Umgebung können Sie mit einem Browser auf Port 8888 zugreifen und Jupyter Notebook verwenden. Sie können eine neue Notiz öffnen, indem Sie oben rechts auf Neu> Python 3 klicken.
In diesem Artikel wird auch eine zufällig erstellte CSV-Datei erstellt https://github.com/suzuki-navi/sample-data/blob/master/sample-data-1.csv Ich benutze.
Lesen Sie verschiedene Importe und Daten.
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("sample-data-1.csv", names=["id", "target", "data1", "data2", "data3"])
df
wird ein Objekt von DataFrame sein.
Lesen Sie den vorherigen Artikel zum Lesen aus CSV und zum Umgang mit DataFrame. Probieren Sie grundlegende Operationen für DataFrame-Qiita aus
Matplotlib documentation https://matplotlib.org/api/_as_gen/matplotlib.pyplot.hist.html#matplotlib.pyplot.hist
plt.hist(df["data1"])
Sie können die Anzahl der Unterteilungen auf der horizontalen Achse mit der Option "Bins" angeben.
plt.hist(df["data1"], bins=30)
Sie können den Bereich auf der horizontalen Achse mit "Bereich" angeben.
plt.hist(df["data1"], range=(-100, 100))
Wenn Sie "Dichte = Wahr" angeben, wird es so normalisiert, dass die Summe der vertikalen Achse 1,0 beträgt.
Matplotlib documentation https://matplotlib.org/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter
plt.scatter(df["data1"], df["data2"])
Wenn Sie in c
eine Spalte mit Ganzzahlen angeben, wird anscheinend jeder Wert farblich gekennzeichnet.
plt.scatter(df["data1"], df["data2"], c = df["target"])
Wenn Sie viele Punkte haben, sollten Sie "Alpha" angeben. 0.0
ist transparent, 1.0
ist undurchsichtig und Sie können den Farbton durch Angabe der Mitte sehen.
plt.scatter(df["data1"], df["data2"], c = df["target"], alpha=0.5)
Es scheint, dass Sie den Bereich der horizontalen Achse mit den Methoden "xlim" und "ylim" angeben können.
plt.xlim(-50, 50)
plt.ylim(-5, 5)
das ist alles.
Recommended Posts