Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend

Dieses Mal kommt es der Datenanalysemethode ernsthaft näher. Ich werde über Visualisierung für Kunden posten.

Graph

Es wird auch als statistisches Diagramm auf Japanisch bezeichnet.

Informationen, die nicht nur durch numerische Werte gelesen werden können Leicht zu verstehen durch Visualisierung etc. Dargestellt durch Diagramme und Zahlen.

Liniendiagramm

Zeichnen Sie die Daten in einer Ebene Ein Diagramm, das die aufgezeichneten Daten mit einer geraden Linie verbindet.

Verwendung: Geeignet zur Visualisierung des Betrags, der sich mit Zeit und Position (Entfernung) ändert. Beispiel: Durch Verknüpfen der Zeit auf der horizontalen Achse (x-Achse) und des Verkaufsvolumens von Produkten auf der vertikalen Achse (y-Achse) Sie können den Übergang des Verkaufsvolumens visualisieren.

image.png

Balkendiagramm

Ein Diagramm, in dem Elemente auf der horizontalen Achse angeordnet sind und die von den Elementen aufgenommenen Werte vertikal durch die Länge der Figur dargestellt werden.

Verwendung: Eine gute Visualisierungsmethode zum Vergleichen der Werte von zwei oder mehr Elementen Beispiel: Geeignet, wenn Sie die Anzahl der Stimmen visualisieren möchten, die die Tagesordnung bei der Abstimmung erhalten hat.

image.png

Histogramm

Wird auch als Häufigkeitsverteilungskarte bezeichnet.

Nach dem Teilen der Daten nach Klassen wird die Häufigkeit innerhalb der Klasse (die Anzahl der in derselben Klasse enthaltenen Daten) berechnet. Grafik ausgedrückt durch Höhe

Verwendung: Verteilung eindimensionaler Daten (z. B. Daten, die durch mehrmaliges Messen der Länge eines Produkts erhalten wurden) Dies ist die am besten geeignete Visualisierungsmethode für die Visualisierung. Beispiel: Volkszählung nach Alter

image.png

Streudiagramm

Ein Diagramm mit Punkten, die der x-Achse bzw. der y-Achse bestimmter Daten entsprechen.

Sie können auch insgesamt drei Elemente in einer Ebene mithilfe der Farbe und Größe der Punkte visualisieren.

Verwendung: Überprüfen Sie, ob die Daten auf die Daten von zwei Elementen konzentriert oder entvölkert sind. Beispiel: Maximale Temperatur und Anzahl des verkauften Eises

image.png

Kuchendiagramm

Ein Diagramm, das kreisförmigen Figuren Winkel von der Mitte entsprechend dem Anteil des Ganzen zuweist

Verwendung: Die am besten geeignete Visualisierungsmethode, wenn Sie den Prozentsatz eines Elements mit dem Ganzen vergleichen möchten. Beispiel: Prozentsatz aller Kunden nach Alter usw.

image.png

Zufällige Generierung

Samen

Der PC generiert eine Zufallszahl basierend auf dem "Startwert".

numpy.random.seed() #Durch jedes Angeben des gleichen Startwerts (Ganzzahl) wird bei jeder Ausführung dieselbe Folge von Zufallszahlen generiert.

Unter den gleichen Bedingungen kann das gleiche Berechnungsergebnis erhalten werden, selbst wenn Zufallszahlen verwendet werden. Daher wird es für Ausgaben verwendet, die Reproduzierbarkeit erfordern, z. B. beim Debuggen.

Wenn Sie keinen Startwert festlegen, wird die Computerzeit als Anfangswert verwendet. Generiert bei jeder Ausführung eine andere Folge von Zufallszahlen.

Generieren Sie Zufallszahlen, die einer Normalverteilung folgen

numpy.random.randn() 

Durch das obige Programm Das Histogramm, das die generierten numerischen Werte darstellt, basiert auf einem Ausdruck, der als Normalverteilung bezeichnet wird. Es hat eine ähnliche Form wie das gezeichnete Diagramm.

Der Graph der Normalverteilung ist in der Mitte am höchsten. Es hat eine symmetrische Glockenform, die nach beiden Seiten abfällt. Der Durchschnittswert erreicht die höchste Position in der Mitte.

Wenn Sie in numpy.random.randn () eine Ganzzahl angeben Gibt Zufallszahlen gemäß der Normalverteilung für die Anzahl der angegebenen Ganzzahlwerte zurück.

Generieren Sie Zufallszahlen, die einer Binomialverteilung folgen

numpy.random.binomial()

Das obige Programm gibt entweder einen erfolgreichen oder einen erfolglosen Versuch zurück. Wenn Sie beispielsweise eine Münze werfen, erhalten Sie immer nur die Vorder- oder Rückseite. Die Wahrscheinlichkeit von Misserfolg und Erfolg beträgt 0,5. Versuchen Sie es so

Es heißt Bernoulli-Prozess.

Bei der Durchführung von n unabhängigen Bernoulli-Versuchen Wahrscheinlichkeitsverteilung, wie oft ein Ereignis auftritt

Es wird eine Binomialverteilung genannt.

Wenn Sie die Ganzzahl n und die reelle Zahl p zwischen 0 und 1 in numpy.random.binomial () angeben Versuchen Sie die Erfolgsrate p so oft wie die angegebene Ganzzahl n Gibt die Anzahl der Erfolge zurück.

Mit anderen Worten wird die Binomialverteilung mit der Anzahl der Versuche n und der Wahrscheinlichkeit p berechnet.

Wenn Sie für das dritte Argument einen ganzzahligen Wert angeben, werden der erste und der zweite Satzversuch ausgeführt. Gibt die Anzahl der Ganzzahlwerte zurück.

#Wenn Sie die Häufigkeit ausgeben möchten, mit der die Tabelle 10.000 Mal angezeigt wird, wenn Sie 100 Mal eine Münze werfen
#Beschreiben Sie wie folgt.

import numpy

numpy.random.binomial(100, 0.5, 10000)
# (Anzahl von Versuchen,確率、Anzahl von Versuchenのセット数)

#Ausgabeergebnis
[52 51 61 ..., 57 53 52]

1.2.4 Nach dem Zufallsprinzip aus der Liste auswählen

numpy.random.choice(x,n)

Wenn Sie im obigen Programm den Listentyp data x und den Integer-Wert n angeben Das Ergebnis der zufälligen Auswahl aus den angegebenen Listentypdaten x Gibt die Anzahl der angegebenen ganzzahligen Werte n zurück.

Daten in chronologischer Reihenfolge

Datum / Uhrzeit-Typ (Datum und Uhrzeit)

Beim Umgang mit Zeitreihendaten benötigen wir eine Möglichkeit, die Zeit darzustellen.

datetime #Datentyp, der Datum und Uhrzeit verarbeitet
datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0)
#Wenn angegeben, wird ein Datum / Uhrzeit-Objekt mit dem angegebenen Datum und der angegebenen Uhrzeit zurückgegeben.
#Jahr(year),Mond(month),Tag(day)Ist obligatorisch. Andere Argumente können weggelassen werden, andernfalls ist es 0.

Es ist obligatorisch, das Jahr, den Monat und den Tag anzugeben. Andere Argumente können weggelassen werden, andernfalls ist es 0.

Zeitdelta-Typ (Zeitübergang)

datetime.timedelta #Ein Datentyp, der die verstrichene Zeit und die Zeitdifferenz darstellt.
datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0) 
#Wenn angegeben, wird ein Zeitdelta-Objekt mit der angegebenen Zeit zurückgegeben.
#Alle Argumente können weggelassen werden, andernfalls ist es 0.
import datetime

td = datetime.timedelta(days=1, seconds=2, microseconds=3, milliseconds=4, minutes=5, hours=6, weeks=7)
print(td)
#Ausgabeergebnis
50 days, 6:05:02.004003
#Sie können auch eine negative Zahl angeben.

td = datetime.timedelta(days=-1, hours=-10)
print(td)
#Ausgabeergebnis
-2 days, 14:00:00

Datetime- und Timedelta-Operationstypen

Indem Sie den Unterschied zwischen Datetime-Objekten ermitteln Sie können Datum und Uhrzeit vergleichen.

Das Ergebnis wird mit einem Zeitdelta-Objekt erhalten. Ebenso ist es möglich, Operationen zwischen Zeitdelta-Objekten auszuführen. Auch hier können Sie Ergebnisse mit einem Timedelta-Objekt erhalten.

Durch Addieren oder Subtrahieren mit dem timedelta-Objekt können Sie leicht die Anzahl der Tage und Stunden bis zum festgelegten Datum und der festgelegten Uhrzeit ermitteln.

import datetime

d1 = datetime.datetime.now()
d2 = datetime.datetime(2019, 9, 20, 19, 45, 0)
td = d2 - d1
print(td)
print(type(td))
#Ausgabeergebnis
243 days, 5:38:45.159115
<class 'datetime.timedelta'>

Erstellen Sie ein Datum / Uhrzeit-Objekt aus einer Zeichenfolge, die die Zeit darstellt

strptime() 
#Generiert und gibt ein datetime-Objekt aus einer Zeichenfolge zurück.
#Zu diesem Zeitpunkt müssen Sie den Formatierungscode angeben, der der ursprünglichen Zeichenfolge entspricht.

Einzelheiten zum Formatierungscode finden Sie auf der offiziellen Python-Website

datetime 
#Grundlegender Datums- und Zeittyp ・ Zeit()Und Strptime()Verhalten
import datetime

s = "2017-12-20 10:00:00"
str_dt = datetime.datetime.strptime(s, "%Y-%m-%d %H:%M:%S")
print(str_dt)
print(type(str_dt))
#Ausgabeergebnis
2017-12-20 10:00:00
<class 'datetime.datetime'>
import datetime as dt

#Eine Saite, die den 22. Oktober 1992 darstellt"Jahr-Mond-Tag"Zuweisen zu Variable s in Form von
s = "1992-10-22"
# -Registrieren Sie sich separat durch

#Konvertieren Sie die Variable s in ein datetime-Objekt, das den 22. Oktober 1992 darstellt, und weisen Sie es der Variablen x zu
x = dt.datetime.strptime(s, "%Y-%m-%d")
#Mit strptime auf Datum konvertieren

#Ausgabe
print(x)

1992-10-22 00:00:00

Daten bearbeiten

Typkonvertierung vom Zeichenfolgentyp zum numerischen Typ

Berechnung des aus einer Datei usw. gelesenen Zahlenwerts Der Typ der gelesenen Daten muss vom Typ int oder vom Typ float sein. Sie können Nur-Zahlen-Zeichenfolgen in int () oder float () konvertieren, um sie in numerische Typen zu konvertieren.

Generieren Sie eine gleichmäßig verteilte Folge von Zahlen 1

numpy.arange() 
#Wenn Sie die Elemente der Liste oder sogar Spalten bestellen möchten(0, 2, 4, ...)Wenn du bekommen willst
numpy.arange(Startwert,Endwert,Intervallwert)
#Wenn angegeben, wird der Startwert zum Endwert-Gibt in festgelegten Intervallen Zahlen bis zu 1 zurück.

np.arange(0, 5, 2) #Wenn Sie eine gerade Spalte von 0 bis 4 erhalten möchten
np.arange(0, 4, 2) #Beachten Sie, dass bei Angabe eine gerade Spalte von 0 bis 2 angezeigt wird.

Generieren Sie eine gleichmäßig verteilte Folge von Zahlen 2

numpy.linspace() #Wenn Sie den angegebenen Bereich in die angegebene Anzahl unterteilen möchten
numpy.linspace(Startwert,Endwert,Wert der Zahl, die Sie teilen möchten)
#Wenn angegeben, werden die zu teilenden Punkte in die angegebene Zahl zurückgegeben.

np.linspace(0, 15, 4) 
#4 Punkte, die den Bereich von 0 bis 15 in gleichen Intervallen 0 teilen, 5, 10,Wenn Sie 15 bekommen wollen

Recommended Posts

Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
Anwendung von Python: Datenvisualisierung Teil 3: Verschiedene Grafiken
Python-Anwendung: Pandas Teil 1: Basic
Python-Anwendung: Datenvisualisierung # 2: matplotlib
Anwendung von Python: Datenbereinigung Teil 1: Python-Notation
Python-Anwendung: Datenverarbeitung # 3: Datenformat
Python-Datenvisualisierungsbibliotheken
Python Basic Memorandum Teil 2
Python-Grundnotiz - Teil 2
Python-Grundnotiz - Teil 1
Anwendung von Python: Datenverarbeitung Teil 2: Analyse verschiedener Datenformate
Python-Anwendung: Pandas Teil 2: Serie
Python-Grammatik-Grundnotiz (1)
Python-Anwendung: Datenverarbeitung Teil 1: Datenformatierung und Dateieingabe / -ausgabe
Python-Anwendung: Numpy Teil 3: Double Array
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Anwendung von Python: Datenbereinigung Teil 2: Datenbereinigung mit DataFrame
Python-Visualisierungstool für die Datenanalyse
Verarbeiten Sie Pubmed .xml-Daten mit Python [Teil 2]
Anwendung von Python: Pandas Teil 4: Verketten und Kombinieren von DataFrames
[Python] Webanwendung von 0! Hands-on (4) -Datenformung-
Empfehlung von Altair! Datenvisualisierung mit Python
Python Basic Memorandum Teil 3 - Informationen zur Objektorientierung
QGIS + Python Teil 2
QGIS + Python Teil 1
Python-Grundschrift
Python: Scraping Teil 1
Grundlegende Grammatik von Python3
Lösung Wenn Sie Python 3.6 oder höher verwenden, benötigen Sie die enum34-Bibliothek ebenfalls nicht. Deinstallieren Sie sie daher und verwenden Sie das Standard-Enum-Modul. Enum34 deinstallieren Führen Sie nach der Deinstallation von enum34 erneut `pip install optuna` aus und Sie haben Optuna erfolgreich installiert! Python, pip, Python3, enum, OptunaPython3 Beginn Teil 1
[Python] Daten lesen
Python: Scraping Teil 2
Erstellen Sie solche Testdaten mit Python (Teil 1)
Echtzeitvisualisierung von Thermografie AMG8833-Daten in Python
Grundlegende Visualisierungstechniken, die aus Kaggle Titanic-Daten gelernt wurden
Datenerfassung von der Analytics-API mit dem Google API-Client für die Python Part 2-Webanwendung
Schöne Grafikzeichnung mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 1
Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung Teil 2
Datenanalyse mit Python 2
Python-Grundkurs (12 Funktionen)
Python Memo Basic Edition
Python-Grundkurs (7 Wörterbuch)
Python-Grundkurs (2 Python-Installation)
Visualisierungsnotiz von Python
Datenanalyse Übersicht Python
Grundmethode der [Python] -Klasse
Python-Grundkurs (11 Ausnahmen)
Verschiedene Python-Visualisierungstools
Datenbereinigung mit Python
Python3 Spickzettel (Basic)
"My Graph Generation Application" von Python (PySide + PyQtGraph) Teil 2
Python-Grundgrammatik (Sonstiges)
Python-Grundkurs (Einführung)
Webanwendung erstellt mit Python3.4 + Django (Teil.1 Umgebungskonstruktion)
Python Basic ② in Windows
Datenvisualisierung mit Pandas