[PYTHON] Seaborn-Grundlagen für Anfänger ① Aggregiertes Diagramm der Anzahl der Daten (Countplot)

Was ist Seaborn

Eine Bibliothek zum Zeichnen von Python-Diagrammen. .. Positioniert als Wrapper-Funktion (im Lieferumfang enthaltenes Programm) von matplotlib, der bekanntesten Waage. Es ist nicht nur in der Lage, auf einfache Weise schön aussehende Grafiken zu zeichnen, sondern verfügt auch über eine Reihe von Funktionen wie die Stapelverarbeitung. Matplotlib ist für detaillierte Spezifikationen und Zeichnungen, und Seaborn ist für einfach und schön.

Vorbereitung

Installieren Sie zuerst die seaborn Bibliothek mit pip. Für Pip? Klicken Sie hier ('https://qiita.com/Yanagawa_Yoshihisa/items/35e6f70a8411277282ce').

Importieren Sie die Bibliothek. Nennen Sie seaborn`` sns und import.

python


import seaborn as sns

Ich werde das Beispiel mit Titanic-Daten ausprobieren. Wenn Sie die Titanic nicht kennen, überprüfen Sie bitte "kaggle Titanic". Erstellen Sie einen Datenrahmen mit Pandas.

python


dataframe = pd.read_csv('train.csv')

Datenanzahl (Countplot)

Dies ist die aggregierte Visualisierung der Anzahl der grundlegendsten Daten. Verwenden Sie dazu Count plot. Grundsätzlich ist die Y-Achse die Anzahl der Fälle. Geben Sie daher nur die X-Achse an. Zeichnen Sie als Beispiel die Beziehung zwischen Pclass (Raumnote) und der Anzahl der Fälle. Geben Sie "P-Klasse" für die X-Achse "x" und "Datenrahmen" für die Originaldaten "Daten" an.

python


sns.countplot(x="Pclass", data=dataframe)

image.png Wenn Sie die Y-Achse angeben, legt sie sich hin.

python


sns.countplot(y="Pclass", data=dataframe)

image.png

Wenn Sie eine Serie hinzufügen möchten, fügen Sie "Farbton" hinzu. (Fügen Sie als Beispiel Sex zu "Farbton" hinzu.)

python


sns.countplot(y="Pclass", data=dataframe, hue='Sex')

image.png

Sie können auch die Reihenfolge und Farbe der Achsen ändern. Wenn Sie interessiert sind, überprüfen Sie dies bitte. Das Ändern des Etiketts usw. ist auch durch Ändern von matplotlib möglich, das die ursprüngliche Wrapper-Quelle ist. Dies ist jedoch kompliziert und wird weggelassen. Mit "Count Plot" sind die Vorteile möglicherweise nicht zu spüren. Ich denke, dass andere "Distplot" -Paarplots, "Joint Plots" usw. vorteilhafter sind.

Schließlich

Wie ein Anfänger verstehen kann, haben wir das notwendige Wissen bei der Implementierung von maschinellem Lernen mit Python als einfachen Artikel zusammengefasst. Das Inhaltsverzeichnis ist hier, daher hoffe ich, dass Sie auch auf andere Artikel verweisen können.

Recommended Posts

Seaborn-Grundlagen für Anfänger ① Aggregiertes Diagramm der Anzahl der Daten (Countplot)
Pandas-Grundlagen für Anfänger ② Übersicht über die Daten
Seaborn Basics für Anfänger ④ Pairplot
Seaborn Grundlagen für Anfänger ② Histogramm (Distplot)
[Muss für Anfänger] Grundlagen von Linux
Lernen Sie die Grundlagen von Python ① Grundlegende Anfänger
Richten Sie die Anzahl der Stichproben zwischen Datenklassen für maschinelles Lernen mit Python aus
[Übersetzung] NumPy Official Tutorial "NumPy: die absoluten Grundlagen für Anfänger"
Ich habe das MNIST-Tutorial von tensorflow für Anfänger ausprobiert.
[Linux] Grundlagen der Berechtigungseinstellung von chmod für Anfänger
[Für Anfänger] Quantifizieren Sie die Ähnlichkeit von Sätzen mit TF-IDF
Seaborn-Grundlagen für Anfänger ③ Streudiagramm (Jointplot) * Mit Histogramm
[Einführung in das logarithmische Diagramm] Prognostizieren Sie die Endzeit jedes Landes anhand des logarithmischen Diagramms der Infektionszahldaten ♬
[Für Anfänger] Ich möchte die Anzahl der Lernerfahrungen leicht verständlich erklären.
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 2
[In kürzester Zeit verstehen] Python-Grundlagen für die Datenanalyse
[Homologie] Zählen Sie mit Python die Anzahl der Löcher in den Daten
Ermitteln Sie die Anzahl der Vorkommen für jedes Element in der Liste
Pandas-Grundlagen für Anfänger ④ Umgang mit Datums- und Zeitangaben
[Python] Die größten Schwächen und Nachteile von Google Colaboratory [Für Anfänger]
[Python] Einführung in die Diagrammerstellung mit Corona-Virendaten [Für Anfänger]
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 1
10. Zählen der Anzahl der Zeilen
Holen Sie sich die Anzahl der Ziffern
Übersicht über Docker (für Anfänger)
Berechnen Sie die Anzahl der Änderungen
Verknüpfte Komponenten des Diagramms
Aggregieren Sie die täglichen Treffer pro Sekunde aus den Webserver-Protokollen in Python
Studieren von Web Scraping zum Extrahieren von Daten aus Filmarks # 2
Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten
Holen Sie sich die Anzahl der Ansichten von Qiita
Pandas Grundlagen für Anfänger ⑧ Ziffernverarbeitung
3 Monate Schichtdaten n Monate Schichtdaten
Berechnung der Anzahl der Assoziationen von Klamer
Überprüfung der Grundlagen von Python (FizzBuzz)
Holen Sie sich die Anzahl der Youtube-Abonnenten
Pandas Basics Summary Link für Anfänger
Informationen zur Grundlagenliste der Python-Grundlagen
[Für Anfänger] Skript innerhalb von 10 Zeilen (5. Resample von Zeitreihendaten mit Pandas)
Annäherungserklärung für Anfänger, um in Kaggle Titanic_3 unter den besten 1,5% (0,83732) zu sein
Diagramm der Geschichte der Anzahl der Ebenen des tiefen Lernens und der Änderung der Genauigkeit
Stellen Sie das Verhältnis von Topcoder, Codeforces und TOEIC nach Bewertung grafisch dar (Pandas + Seaborn).
[Beispiel für eine Python-Verbesserung] Was ist die empfohlene Lernseite für Python-Anfänger?
Stellen Sie die Änderung der Anzahl der Keyword-Auftritte pro Monat mithilfe von Pandas grafisch dar
Annäherungserklärung für Anfänger, um in Kaggle Titanic_1 unter den besten 1,5% (0,83732) zu sein
[Für Anfänger] Warum brauchen Sie das "Gewicht" und die "Tendenz" des neuronalen Netzwerks?
Holen Sie sich den Schlüssel für die Migration von JSON-Daten auf der zweiten Ebene mit Python
Annäherungserklärung für Anfänger, um in Kaggle Titanic_2 unter den besten 1,5% (0,83732) zu sein
[Einführung in Data Scientist] Grundlagen der wissenschaftlichen Berechnung, Datenverarbeitung und Verwendung der Grafikzeichnungsbibliothek ♬ Umgebungskonstruktion