Dieses Mal kommt es der Datenanalysemethode ernsthaft näher. Ich werde über Visualisierung für Kunden posten.
Es wird auch als statistisches Diagramm auf Japanisch bezeichnet.
Informationen, die nicht nur durch numerische Werte gelesen werden können Leicht zu verstehen durch Visualisierung etc. Dargestellt durch Diagramme und Zahlen.
Zeichnen Sie die Daten in einer Ebene Ein Diagramm, das die aufgezeichneten Daten mit einer geraden Linie verbindet.
Verwendung: Geeignet zur Visualisierung des Betrags, der sich mit Zeit und Position (Entfernung) ändert. Beispiel: Durch Verknüpfen der Zeit auf der horizontalen Achse (x-Achse) und des Verkaufsvolumens von Produkten auf der vertikalen Achse (y-Achse) Sie können den Übergang des Verkaufsvolumens visualisieren.
Ein Diagramm, in dem Elemente auf der horizontalen Achse angeordnet sind und die von den Elementen aufgenommenen Werte vertikal durch die Länge der Figur dargestellt werden.
Verwendung: Eine gute Visualisierungsmethode zum Vergleichen der Werte von zwei oder mehr Elementen Beispiel: Geeignet, wenn Sie die Anzahl der Stimmen visualisieren möchten, die die Tagesordnung bei der Abstimmung erhalten hat.
Wird auch als Häufigkeitsverteilungskarte bezeichnet.
Nach dem Teilen der Daten nach Klassen wird die Häufigkeit innerhalb der Klasse (die Anzahl der in derselben Klasse enthaltenen Daten) berechnet. Grafik ausgedrückt durch Höhe
Verwendung: Verteilung eindimensionaler Daten (z. B. Daten, die durch mehrmaliges Messen der Länge eines Produkts erhalten wurden) Dies ist die am besten geeignete Visualisierungsmethode für die Visualisierung. Beispiel: Volkszählung nach Alter
Ein Diagramm mit Punkten, die der x-Achse bzw. der y-Achse bestimmter Daten entsprechen.
Sie können auch insgesamt drei Elemente in einer Ebene mithilfe der Farbe und Größe der Punkte visualisieren.
Verwendung: Überprüfen Sie, ob die Daten auf die Daten von zwei Elementen konzentriert oder entvölkert sind. Beispiel: Maximale Temperatur und Anzahl des verkauften Eises
Ein Diagramm, das kreisförmigen Figuren Winkel von der Mitte entsprechend dem Anteil des Ganzen zuweist
Verwendung: Die am besten geeignete Visualisierungsmethode, wenn Sie den Prozentsatz eines Elements mit dem Ganzen vergleichen möchten. Beispiel: Prozentsatz aller Kunden nach Alter usw.
Der PC generiert eine Zufallszahl basierend auf dem "Startwert".
numpy.random.seed() #Durch jedes Angeben des gleichen Startwerts (Ganzzahl) wird bei jeder Ausführung dieselbe Folge von Zufallszahlen generiert.
Unter den gleichen Bedingungen kann das gleiche Berechnungsergebnis erhalten werden, selbst wenn Zufallszahlen verwendet werden. Daher wird es für Ausgaben verwendet, die Reproduzierbarkeit erfordern, z. B. beim Debuggen.
Wenn Sie keinen Startwert festlegen, wird die Computerzeit als Anfangswert verwendet. Generiert bei jeder Ausführung eine andere Folge von Zufallszahlen.
numpy.random.randn()
Durch das obige Programm Das Histogramm, das die generierten numerischen Werte darstellt, basiert auf einem Ausdruck, der als Normalverteilung bezeichnet wird. Es hat eine ähnliche Form wie das gezeichnete Diagramm.
Der Graph der Normalverteilung ist in der Mitte am höchsten. Es hat eine symmetrische Glockenform, die nach beiden Seiten abfällt. Der Durchschnittswert erreicht die höchste Position in der Mitte.
Wenn Sie in numpy.random.randn () eine Ganzzahl angeben Gibt Zufallszahlen gemäß der Normalverteilung für die Anzahl der angegebenen Ganzzahlwerte zurück.
numpy.random.binomial()
Das obige Programm gibt entweder einen erfolgreichen oder einen erfolglosen Versuch zurück. Wenn Sie beispielsweise eine Münze werfen, erhalten Sie immer nur die Vorder- oder Rückseite. Die Wahrscheinlichkeit von Misserfolg und Erfolg beträgt 0,5. Versuchen Sie es so
Es heißt Bernoulli-Prozess.
Bei der Durchführung von n unabhängigen Bernoulli-Versuchen Wahrscheinlichkeitsverteilung, wie oft ein Ereignis auftritt
Es wird eine Binomialverteilung genannt.
Wenn Sie die Ganzzahl n und die reelle Zahl p zwischen 0 und 1 in numpy.random.binomial () angeben Versuchen Sie die Erfolgsrate p so oft wie die angegebene Ganzzahl n Gibt die Anzahl der Erfolge zurück.
Mit anderen Worten wird die Binomialverteilung mit der Anzahl der Versuche n und der Wahrscheinlichkeit p berechnet.
Wenn Sie für das dritte Argument einen ganzzahligen Wert angeben, werden der erste und der zweite Satzversuch ausgeführt. Gibt die Anzahl der Ganzzahlwerte zurück.
#Wenn Sie die Häufigkeit ausgeben möchten, mit der die Tabelle 10.000 Mal angezeigt wird, wenn Sie 100 Mal eine Münze werfen
#Beschreiben Sie wie folgt.
import numpy
numpy.random.binomial(100, 0.5, 10000)
# (Anzahl von Versuchen,確率、Anzahl von Versuchenのセット数)
#Ausgabeergebnis
[52 51 61 ..., 57 53 52]
numpy.random.choice(x,n)
Wenn Sie im obigen Programm den Listentyp data x und den Integer-Wert n angeben Das Ergebnis der zufälligen Auswahl aus den angegebenen Listentypdaten x Gibt die Anzahl der angegebenen ganzzahligen Werte n zurück.
Beim Umgang mit Zeitreihendaten benötigen wir eine Möglichkeit, die Zeit darzustellen.
datetime #Datentyp, der Datum und Uhrzeit verarbeitet
datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0)
#Wenn angegeben, wird ein Datum / Uhrzeit-Objekt mit dem angegebenen Datum und der angegebenen Uhrzeit zurückgegeben.
#Jahr(year),Mond(month),Tag(day)Ist obligatorisch. Andere Argumente können weggelassen werden, andernfalls ist es 0.
Es ist obligatorisch, das Jahr, den Monat und den Tag anzugeben. Andere Argumente können weggelassen werden, andernfalls ist es 0.
datetime.timedelta #Ein Datentyp, der die verstrichene Zeit und die Zeitdifferenz darstellt.
datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0)
#Wenn angegeben, wird ein Zeitdelta-Objekt mit der angegebenen Zeit zurückgegeben.
#Alle Argumente können weggelassen werden, andernfalls ist es 0.
import datetime
td = datetime.timedelta(days=1, seconds=2, microseconds=3, milliseconds=4, minutes=5, hours=6, weeks=7)
print(td)
#Ausgabeergebnis
50 days, 6:05:02.004003
#Sie können auch eine negative Zahl angeben.
td = datetime.timedelta(days=-1, hours=-10)
print(td)
#Ausgabeergebnis
-2 days, 14:00:00
Indem Sie den Unterschied zwischen Datetime-Objekten ermitteln Sie können Datum und Uhrzeit vergleichen.
Das Ergebnis wird mit einem Zeitdelta-Objekt erhalten. Ebenso ist es möglich, Operationen zwischen Zeitdelta-Objekten auszuführen. Auch hier können Sie Ergebnisse mit einem Timedelta-Objekt erhalten.
Durch Addieren oder Subtrahieren mit dem timedelta-Objekt können Sie leicht die Anzahl der Tage und Stunden bis zum festgelegten Datum und der festgelegten Uhrzeit ermitteln.
import datetime
d1 = datetime.datetime.now()
d2 = datetime.datetime(2019, 9, 20, 19, 45, 0)
td = d2 - d1
print(td)
print(type(td))
#Ausgabeergebnis
243 days, 5:38:45.159115
<class 'datetime.timedelta'>
strptime()
#Generiert und gibt ein datetime-Objekt aus einer Zeichenfolge zurück.
#Zu diesem Zeitpunkt müssen Sie den Formatierungscode angeben, der der ursprünglichen Zeichenfolge entspricht.
Einzelheiten zum Formatierungscode finden Sie auf der offiziellen Python-Website
datetime
#Grundlegender Datums- und Zeittyp ・ Zeit()Und Strptime()Verhalten
import datetime
s = "2017-12-20 10:00:00"
str_dt = datetime.datetime.strptime(s, "%Y-%m-%d %H:%M:%S")
print(str_dt)
print(type(str_dt))
#Ausgabeergebnis
2017-12-20 10:00:00
<class 'datetime.datetime'>
import datetime as dt
#Eine Saite, die den 22. Oktober 1992 darstellt"Jahr-Mond-Tag"Zuweisen zu Variable s in Form von
s = "1992-10-22"
# -Registrieren Sie sich separat durch
#Konvertieren Sie die Variable s in ein datetime-Objekt, das den 22. Oktober 1992 darstellt, und weisen Sie es der Variablen x zu
x = dt.datetime.strptime(s, "%Y-%m-%d")
#Mit strptime auf Datum konvertieren
#Ausgabe
print(x)
1992-10-22 00:00:00
Berechnung des aus einer Datei usw. gelesenen Zahlenwerts Der Typ der gelesenen Daten muss vom Typ int oder vom Typ float sein. Sie können Nur-Zahlen-Zeichenfolgen in int () oder float () konvertieren, um sie in numerische Typen zu konvertieren.
numpy.arange()
#Wenn Sie die Elemente der Liste oder sogar Spalten bestellen möchten(0, 2, 4, ...)Wenn du bekommen willst
numpy.arange(Startwert,Endwert,Intervallwert)
#Wenn angegeben, wird der Startwert zum Endwert-Gibt in festgelegten Intervallen Zahlen bis zu 1 zurück.
np.arange(0, 5, 2) #Wenn Sie eine gerade Spalte von 0 bis 4 erhalten möchten
np.arange(0, 4, 2) #Beachten Sie, dass bei Angabe eine gerade Spalte von 0 bis 2 angezeigt wird.
numpy.linspace() #Wenn Sie den angegebenen Bereich in die angegebene Anzahl unterteilen möchten
numpy.linspace(Startwert,Endwert,Wert der Zahl, die Sie teilen möchten)
#Wenn angegeben, werden die zu teilenden Punkte in die angegebene Zahl zurückgegeben.
np.linspace(0, 15, 4)
#4 Punkte, die den Bereich von 0 bis 15 in gleichen Intervallen 0 teilen, 5, 10,Wenn Sie 15 bekommen wollen
Recommended Posts