[PYTHON] Pandas-Grundlagen für Anfänger ③ Erstellen Sie ein Histogramm mit matplotlib

Was ist Pandas?

Ein Datenrahmenobjekt für die Verarbeitung strukturierter Daten in Python. Danach können Sie problemlos Dateien lesen und SQL-Vorgänge ausführen. Dies ist für die Verarbeitung, Berechnung und Visualisierung von Daten durch maschinelles Lernen erforderlich. Eine Memoliste häufig verwendeter Syntaxen für die Datenmanipulation. Dieser Abschnitt befasst sich mit dem Lesen und Verarbeiten von Daten.

Histogramm

Das Histogramm wird häufig zur Datenbestätigung in der Vorbereitungsphase verwendet. Dieses Mal werden wir die matplotlib-Bibliothek verwenden. Sie können problemlos ein problematisches Histogramm erstellen, indem Sie es in Excel ausführen. Für die Daten haben wir die bekannten Titanic-Daten verwendet.

Bibliotheksimport & Datenladen

Nennen Sie pandas pd und importieren Sie es. Dieses Mal wurde auch matplotlib.pyplot mit dem Namen plt importiert. Verwenden Sie Beispieldaten von Titanic

python


import pandas as pd
import matplotlib.pyplot as plt
dataframe = pd.read_csv('train.csv')
dataframe.head()

Histogramm erstellen

Erstellen Sie ein Histogramm nach Alter (Spalte "Alter"). Löschen Sie den fehlenden Wert mit dropna ().

python


plt.hist(dataframe['Age'].dropna(),bins = 10, range = (0,100),color = 'Blue')
plt.show()

スクリーンショット 2020-07-09 14.29.30.png

Geben Sie die Behälter (Anzahl der anzuzeigenden Flaschen), den Bereich (Datenbreite) und die Farbe (Farbe) an.

Histogramm erstellen (Normalisierung)

Normalisieren Sie so, dass die Gesamtsumme 1 beträgt.

python


plt.hist(dataframe['Age'].dropna(),bins = 20, range = (0,100),color = 'Blue', normed = 'true')
plt.show()

スクリーンショット 2020-07-09 14.36.59.png

Titel hinzufügen usw.

Fügen Sie Titel usw. hinzu, um die Anzeige zu vereinfachen.

python


plt.title('Age Histogram', fontsize=14)
plt.xlabel('Age', fontsize=14)
plt.grid(True) 
plt.hist(dataframe['Age'].dropna(),bins = 20, range = (0,100),color = 'Blue')
plt.show()

スクリーンショット 2020-07-09 14.57.21.png

Fügen Sie .title, .xlabel, .grid hinzu.

Gestapelte Anzeige

Die Aufschlüsselungsanzeige von männlich (männlich) und weiblich (weiblich) wird unter Verwendung der gestapelten Anzeige angezeigt. Definieren Sie zur Vorbereitung des Plots malelist_m bzw. malelist_f.

python


malelist_m = dataframe['Sex'] == 'male'
malelist_f = dataframe['Sex'] == 'female'

plt.title('Age Histogram', fontsize=14)
plt.xlabel('Age', fontsize=14)
plt.grid(True) 
plt.hist([dataframe[malelist_m]['Age'],dataframe[malelist_f]['Age']],bins = 20, range = (0,100), color = ['Blue', 'Red'], label = ['male','femal'], stacked=True)
plt.legend(loc="upper right", fontsize=14) 
plt.show()

スクリーンショット 2020-07-09 15.59.04.png

Wenn Sie mehr als eine stapeln möchten, schreiben Sie als hist ([X1, X2]). Setzen Sie gestapelt auf True, um zu stapeln. (Auch als Falsch geschrieben) Definieren Sie die Legende mit Beschriftung. Fügen Sie eine Legende mit .legend hinzu.

Recommended Posts

Pandas-Grundlagen für Anfänger ③ Erstellen Sie ein Histogramm mit matplotlib
Seaborn-Grundlagen für Anfänger ③ Streudiagramm (Jointplot) * Mit Histogramm
Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten
Pandas Grundlagen für Anfänger ⑧ Ziffernverarbeitung
Seaborn Grundlagen für Anfänger ② Histogramm (Distplot)
Pandas Basics Summary Link für Anfänger
Histogramm mit Matplotlib
WebApi-Erstellung mit Python (CRUD-Erstellung) Für Anfänger
Pandas-Grundlagen für Anfänger ② Übersicht über die Daten
Seaborn Basics für Anfänger ④ Pairplot
100 Pandas klopfen für Python-Anfänger
Pandas-Grundlagen für Anfänger ④ Umgang mit Datums- und Zeitangaben
Vielseitige Datenerfassung mit Pandas + Matplotlib
[Muss für Anfänger] Grundlagen von Linux
Schreiben Sie ein gestapeltes Histogramm mit matplotlib
[Pandas] Ich habe versucht, Verkaufsdaten mit Python zu analysieren. [Für Anfänger]
INSERT in MySQL mit Python [Für Anfänger]
Pandas Grundlagen
Heat Map für die Rastersuche mit Matplotlib
Tipps zum Zeichnen mehrerer Linien mit Pandas
Zeichnen Sie eine hierarchische Achsenbeschriftung mit matplotlib + pandas
Erste Schritte mit Python für PHPer-Super Basics
[Python] Bilder mit OpenCV lesen (für Anfänger)
Pandas Grundlagen
[Für Anfänger] Versuchen Sie Web Scraping mit Python
Best Practices für den Umgang mit Daten mit Pandas
Python-Lernnotiz für maschinelles Lernen von Chainer Kapitel 11 und 12 Einführung in Pandas Matplotlib
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
Kausales Denken und kausale Suche von Python (für Anfänger)
Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib
Zeichnen Sie die ROC-Kurve für die binäre Klassifizierung mit Matplotlib
Lassen Sie uns den Infektionsstatus des Corona-Virus mit Plotly [für Anfänger] visualisieren.
Machen Sie vorerst ein Histogramm (matplotlib)
Django Tutorial Zusammenfassung für Anfänger von Anfängern ① (Projekterstellung ~)
Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib
~ Tipps für Python-Anfänger mit Liebe von Pythonista ① ~
Analysieren Sie Apache-Zugriffsprotokolle mit Pandas und Matplotlib
~ Tipps für Python-Anfänger mit Liebe von Pythonista ② ~
[Einführung für Anfänger] Umgang mit MySQL mit Python
# Python-Grundlagen (#matplotlib)
Animation mit matplotlib
Japanisch mit Matplotlib
Animation mit matplotlib
Erstellen Sie eine Animation mit matplotlib
Extrahieren Sie mit Pandas DataFrame N Proben für jede Gruppe
[Für Anfänger] Skript innerhalb von 10 Zeilen (8. Plotkarte mit Folium [2]
(Für diejenigen, die mit Matplotlib nicht vertraut sind) Tipps zum Zeichnen von Diagrammen mit Seaborn
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
[Linux] Grundlagen der Berechtigungseinstellung von chmod für Anfänger
[Python] So erstellen Sie mit Matplotlib ein zweidimensionales Histogramm
[Für Anfänger] Quantifizieren Sie die Ähnlichkeit von Sätzen mit TF-IDF