Verwenden wir Python, um die Häufigkeit der in einem Datenrahmen enthaltenen Binärdaten in einem einzelnen Balkendiagramm darzustellen.

Bei der Überprüfung des Inhalts der Daten Es kann vorkommen, dass Sie darstellen möchten, wie viele Binärdaten in einem einzelnen Balkendiagramm enthalten sind.

War es ein schlechter Weg, es zu finden? Ich habe keine präzise Möglichkeit gefunden, es mit einem einzelnen Balkendiagramm darzustellen, daher werde ich auch die Ausgabe einbeziehen.

Dieses Mal erstelle ich ein Balkendiagramm, das nicht nur Binärdaten, sondern auch 6-Wert-Daten enthält.

Umgebung

Ich habe Google Colab verwendet. Die Version der verwendeten Bibliothek lautet wie folgt.

Bibliothek Ausführung
python 3.6.9
pandas 1.1.4
seaborn 0.11.0
matplotlib 3.2.2

Bibliothek importieren

Importieren Sie das obige Modul, bevor Sie es verwenden.

%matplotlib inline
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt

Datensatzimport

Dieses Mal verwenden wir die Tipps des Trainingsdatensatzes, der in seaborn enthalten ist. Dieser Datensatz hat Es enthält den Gesamtbetrag für Abendessen und Mittagessen, die Anzahl der enthaltenen Chips und das Geschlecht der Person, die bezahlt hat.

#Datenrahmen importieren
tips = sns.load_dataset('tips')

#Überprüfen Sie die ersten 5 Zeilen
display(tips.head())
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4

Wenn Sie die obige Ausgabe sehen, ist der Import erfolgreich.

Datenverarbeitung

Erstellen Sie ein Balkendiagramm mit den folgenden vier Spalten. Um ein Diagramm zu erstellen, müssen Sie qualitative Werte in quantitative Werte konvertieren.

Spaltenname Überblick Politik
sex Sex(Male/Female) Male -> 0, Female -> 1
smoker Rauchen(No/Yes) No -> 0, Yes -> 1
time Essenszeit(Lunch/Dinner) Lunch -> 0, Dinner -> 1
size Anzahl der Personen(1 ~ 6) Verwenden Sie es wie es ist

Ich denke, es gibt viele Möglichkeiten, dies zu tun. Es wurde wie folgt durchgeführt.

#Sex quantifizieren(Male1 -> 0, Female -> 1)
tips.sex = tips.sex.replace("Male", 0).replace("Female", 1)

#Raucher quantifizieren(No -> 0, Yes -> 1)
tips.smoker = tips.smoker.replace("No", 0).replace("Yes", 1)

#Zeit quantifizieren(Lunch -> 0, Dinner -> 1)
tips.time = tips.time.replace("Lunch", 0).replace("Dinner", 1)

#Überprüfen Sie die ersten 5 Zeilen
display(tips.head())
total_bill tip sex smoker day time size
0 16.99 1.01 1 0 Sun 1 2
1 10.34 1.66 0 0 Sun 1 3
2 21.01 3.50 0 0 Sun 1 3
3 23.68 3.31 0 0 Sun 1 2
4 24.59 3.61 1 0 Sun 1 4

Auf diese Weise können Sie sehen, dass es durch 0 und 1 ersetzt wurde.

Grafikfrequenz

Nun zum Hauptthema. Definieren Sie die Spaltennamen, die in das Balkendiagramm aufgenommen werden sollen, in Beschriftung im Listenformat. Erhalten Sie dann den eindeutigen Wert für jede Spalte und ihre Nummer. In diesem Zustand ist Index der Spaltenname und Spaltenname der Wert, sodass die Ersetzung ausgeführt wird.

#Definition der Beschriftungsliste, die im Balkendiagramm gespeichert werden soll
label = ["sex", "smoker", "time", "size"]

#Holen Sie sich einen eindeutigen Wert für jedes Etikett
tips_ = [tips[l].value_counts() for l in label]

#In Datenrahmen konvertieren und Index und Spalte austauschen
tips_ = pd.DataFrame(tips_).transpose()

#Grafik anzeigen
tips_.plot.bar()
plt.grid()
plt.title("Frequency of values in each label")
plt.ylabel("counts")
plt.xlabel("value")
plt.show()

image.png

Auf diese Weise konnte ich das Diagramm erstellen, das ich finden wollte.

Zusammenfassung

Ich habe mit value_counts einen neuen Datenrahmen erstellt und ein Balkendiagramm der Häufigkeit ausgegeben.

Referenziert

Recommended Posts

Verwenden wir Python, um die Häufigkeit der in einem Datenrahmen enthaltenen Binärdaten in einem einzelnen Balkendiagramm darzustellen.
Verwenden wir die offenen Daten von "Mamebus" in Python
Verwendung der Methode __call__ in der Python-Klasse
Wie kann man schnell die Häufigkeit des Auftretens von Zeichen aus einer Zeichenfolge in Python zählen?
Ich habe in Python ein Programm erstellt, das die 1-Minuten-Daten von FX auf eine beliebige Zeit (1 Stunde usw.) ändert.
So bestimmen Sie die Existenz eines Selenelements in Python
[Einführung in Python] Wie verwende ich den Operator in in der for-Anweisung?
So überprüfen Sie die Speichergröße eines Wörterbuchs in Python
So senden Sie ein visualisiertes Bild der in Python erstellten Daten an Typetalk
Ich habe ein Programm erstellt, um die Größe einer Datei mit Python zu überprüfen
Ich habe versucht, den Höhenwert von DTM in einem Diagramm anzuzeigen
Verschiedene Möglichkeiten, die letzte Zeile einer CSV-Datei in Python zu lesen
So übergeben Sie das Ergebnis der Ausführung eines Shell-Befehls in einer Liste in Python
Verwendung der C-Bibliothek in Python
Zeichnen Sie in Python ein Diagramm einer quadratischen Funktion
Holen Sie sich den Aufrufer einer Funktion in Python
Kopieren Sie die Liste in Python
Zusammenfassung der Verwendung von MNIST mit Python
Verwenden Sie PIL in Python, um nur die gewünschten Daten aus Exif zu extrahieren
Link zu den Datenpunkten des von jupyterlab & matplotlib erstellten Diagramms
Die Geschichte des Lesens von HSPICE-Daten in Python
Ändern Sie den Datenrahmen der Pandas-Kaufdaten (ID x Produkt) in ein Wörterbuch
Ausgabe in Form eines Python-Arrays
Grundlegende Datenrahmenoperationen, die von Anfängern in einer Woche Python-Lernen geschrieben wurden
Aufgezeichnete Umgebung für die Datenanalyse mit Python
So erhalten Sie mit Python eine Liste der Dateien im selben Verzeichnis
[Einführung in Python] So erhalten Sie den Datenindex mit der for-Anweisung
Verwenden Sie Pandas, um nur die angegebenen Zeilen des Datenrahmens in die Excel-Datei zu schreiben
Ich möchte eine Python-Datenquelle in Re: Dash verwenden, um Abfrageergebnisse zu erhalten
Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt
Was tun, wenn der Fortschrittsbalken in tqdm von Python nicht angezeigt wird?
Ermitteln Sie die maximale Anzahl von Zeichen in mehrzeiligem Text, die in einem Datenrahmen gespeichert sind
So überprüfen Sie in Python, ob sich eines der Elemente einer Liste in einer anderen Liste befindet
Machen wir einen Sprung in die Fertigungsindustrie, indem wir zusätzlich zu Python das Web nutzen
Ich habe versucht, die in Python installierten Pakete grafisch darzustellen
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
So ermitteln Sie die Anzahl der Stellen in Python
Ich möchte in Python schreiben! (2) Schreiben wir einen Test
[Python] Verwendung der Diagrammerstellungsbibliothek Altair
Verwenden wir die Python-Version des Confluence-API-Moduls.
Den Inhalt der Daten in Python nicht kennen
Verwendung des in Lobe in Python erlernten Modells
Ein Memorandum über die Umsetzung von Empfehlungen in Python
Um das Äquivalent von Rubys ObjectSpace._id2ref in Python zu tun
Ich möchte R-Datensatz mit Python verwenden
Python Hinweis: Das Rätsel, einer Variablen eine Variable zuzuweisen
[C / C ++] Übergeben Sie den in C / C ++ berechneten Wert an eine Python-Funktion, um den Prozess auszuführen, und verwenden Sie diesen Wert in C / C ++.
Verwenden Sie Hash, um das Kollisionsurteil von etwa 1000 Bällen in Python zu erleichtern (im Zusammenhang mit dem neuen Corona-Virus).
Ruft den Wert eines bestimmten Schlüssels bis zum angegebenen Index der Wörterbuchliste in Python ab
[OCI] Python-Skript zum Abrufen der IP-Adresse einer Recheninstanz in Cloud Shell
[Python] Programmieren, um die Nummer von a in einer Zeichenfolge zu finden, die eine bestimmte Anzahl von Malen wiederholt.
Was scheint eine Vorlage für den Standardeingabe-Teil des Competition Pro in Python3 zu sein
Ich habe eine Funktion zum Trimmen des Bildes von Python openCV erstellt. Verwenden Sie sie daher bitte.
Darstellung der Verteilung der Bakterienzusammensetzung aus Qiime2-Analysedaten in einem Box-Whisker-Diagramm
Ich schrieb einen Test in "Ich habe versucht, die Wahrscheinlichkeit eines Bingospiels mit Python zu simulieren".
Übergeben des Ausführungsergebnisses eines Shell-Befehls in einer Liste in Python (nicht blockierende Version)
Finden Sie die scheinbare Breite einer Zeichenfolge in Python heraus
Lassen Sie das Gleichungsdiagramm der linearen Funktion in Python zeichnen
Verschiedene Methoden zur Berechnung der Ähnlichkeit zwischen Daten mit Python