1. Mit Python 1-2 gelernte Statistiken. Berechnung verschiedener Statistiken (Numpy)

Schauen wir uns zunächst die Nützlichkeit von Pandas und Numpy an.

Daher kann gesagt werden, dass Pandas und Numpy oft Schritt für Schritt kombiniert und beispielsweise in der folgenden Reihe von Flüssen verwendet werden. 001_002_002.PNG

** ⑴ Daten vorbereiten **

data = [12, 3, 5, 2, 6, 7, 9, 6, 4, 11]

Ich habe eine Python-Standardliste erstellt, indem ich die Werte direkt in "Variablenname = []" geschrieben habe, getrennt durch Kommas. Im Folgenden werden verschiedene Statistiken mit Numpy berechnet.

** ⑵ Berechnen Sie den Durchschnittswert **

np.mean(data)

001_002_001.PNG

Die "Mittelwert" -Funktion von Numpy berechnete einen Durchschnitt von 6,5.

** ⑶ Berechne den Median **

np.median(data)

001_002_003.PNG

Numpys "Median" -Funktion berechnete einen Median von 6,0. Wenn die Daten in der Reihenfolge ihrer Größe sortiert werden, wird der Wert genau in der Mitte auch als Median bezeichnet. Wenn es gleich dem zweiten Quadranten ist und mehrere Daten vorhanden sind, ist dies der Durchschnitt von zwei Werten nahe der Mitte.

** ⑷ Berechnen Sie den Gesamtwert **

np.sum(data)

001_002_004.PNG

Numpys "Summen" -Funktion berechnete einen Gesamtwert von 65.

** ⑸ Standardabweichung berechnen **

np.std(data)

001_002_005.PNG

Numpys "std" -Funktion ergab das Ergebnis 3.138470965295043. Dies ist jedoch der Wert der ** Populationsstandardabweichung **. Bitte beachten Sie, dass es zwei Arten von Standardabweichungen gibt, die Populationsstandardabweichung und die ** unverzerrte Standardabweichung **.

** Population und Exemplar </ font> **

Das gesamte Forschungs- oder Forschungsthema wird als ** Population ** bezeichnet, und der aus der Population extrahierte Teil wird als ** Stichprobe ** bezeichnet. Umfragen, die die gesamte Bevölkerung untersuchen, werden als ** 100% -Umfragen ** oder ** Gesamtumfragen ** bezeichnet. Typische Beispiele sind die "nationale Umfrage", bei der alle in Japan lebenden Personen antworten müssen, und die "statistische Umfrage zu Unternehmensbetrieben / Unternehmen", die als nationale Volkszählung von Unternehmensbetrieben bezeichnet werden kann. Wahrscheinlich. Mit anderen Worten, fast alle Daten, die in der realen Welt verarbeitet werden, können als Stichproben aus Stichprobenerhebungen bezeichnet werden. Ich möchte jedoch die Merkmale und Tendenzen der Exemplare nicht kennen und versuche immer, die Merkmale und Tendenzen der Population abzuschätzen, während ich auf die Exemplare ziele. Nun werden zwei Statistiken benötigt, um die Standardabweichung zu berechnen. Zunächst wird der Mittelwert berechnet, die Varianz daraus berechnet und die Quadratwurzel der Varianz als Standardabweichung verwendet. Dem Mittelwert, der Varianz und der Standardabweichung, die aus der Stichprobe berechnet wurden, wird "Stichprobe" bzw. "unverzerrt" vorangestellt, und ** Stichprobenmittelwert $ \ bar {X} $ **, ** unverzerrte Varianz $ s ^ 2 Sie heißen $ ** und ** unverzerrte Standardabweichung $ s $ **. Andererseits sind der Mittelwert, die Varianz und die Standardabweichung der aus der Stichprobe geschätzten Population ** Populationsmittelwert $ μ $ **, ** Populationsvarianz $ σ ^ 2 $ **, ** Populationsstandardabweichung $ σ. Wir nennen es $ **, um es zu unterscheiden.

Gehen Sie daher wie folgt vor, wenn Sie Numpy zur Berechnung der unverzerrten Standardabweichung verwenden.

np.std(data, ddof=1) 

001_002_006.PNG

Vergleichen wir es mit der Standardabweichung, die zuvor mit Pandas berechnet wurde.

df = pd.DataFrame(data) #Konvertieren Sie Daten in Pandas Datenrahmen
df.describe().loc['std']

001_002_007.PNG

Die Standardabweichung von Pandas ist eine unvoreingenommene Standardabweichung.


Als nächstes berechnen wir die grundlegenden Statistiken mithilfe von Statistiken, einer Standard-Python-Bibliothek.

Recommended Posts

1. Mit Python 1-2 gelernte Statistiken. Berechnung verschiedener Statistiken (Numpy)
1. Mit Python 1-3 gelernte Statistiken. Berechnung verschiedener Statistiken (Statistiken)
[Python] Berechnungsmethode mit numpy
1. Mit Python 1-1 gelernte Statistiken. Grundlegende Statistiken (Pandas)
1. Mit Python gelernte Statistiken 2. Wahrscheinlichkeitsverteilung [Gründliches Verständnis von scipy.stats]
Berechnung des Python-Numpy-Arrays
1. Mit Python 2-1 gelernte Statistiken. Wahrscheinlichkeitsverteilung [diskrete Variable]
Verschiedene Verarbeitung von Python
Numerische Berechnung mit Python
Lernen Sie langsam mit Python "Prinzip der Abhängigkeitsumkehr"
Berechnung der gegenseitigen Informationsmenge (kontinuierlicher Wert) mit numpy
Mit Python erlernte Derivate- (1) Berechnung des Devisenterminkurses-
[Grundlagen der modernen mathematischen Statistik mit Python] Kapitel 1: Wahrscheinlichkeit
SMO mit Python + NumPy implementiert
Über verschiedene Codierungen von Python 3
Bearbeiten Sie verschiedene Datenbanken mit Python
[Wissenschaftlich-technische Berechnung von Python] Grundlegende Operation des Arrays, numpy
[Python] Mit Pokemon erlernte objektorientierte Programmierung
Perceptron-Lernexperiment mit Python
Python-Datenstruktur mit Chemoinfomatik gelernt
Lebensspiel mit Python! (Conways Spiel des Lebens)
Effiziente Netzaufnahme mit Python
10 Funktionen von "Sprache mit Batterie" Python
Implementierung der Dyxtra-Methode durch Python
[Python] Berechnung des Kappa (k) -Koeffizienten
Koexistenz von Python2 und 3 mit CircleCI (1.0)
Grundlegendes Studium von OpenCV mit Python
[Algorithmus x Python] Berechnung der Basisstatistik Teil2 (Mittelwert, Median, am häufigsten)
[Algorithmus x Python] Berechnung der Basisstatistik (Gesamtwert, Maximalwert, Minimalwert)
[Grundlagen der modernen mathematischen Statistik mit Python] Kapitel 3: Typische Wahrscheinlichkeitsverteilung
Grundlagen der binärisierten Bildverarbeitung durch Python
[Beispiel für eine Python-Verbesserung] Python mit Codecademy lernen
Ich habe die numerische Berechnung von Python durch Rust ersetzt und die Geschwindigkeit verglichen
Bedingte Verzweigung von Python mit Chemoinfomatik gelernt
Überprüfen Sie die Existenz der Datei mit Python
Verstopft mit Python-Update der GCP-Konsole ①
Einfache Einführung der Spracherkennung mit Python
[Python] Berechnung der Bildähnlichkeit (Würfelkoeffizient)
Quellcode für die Trennung von Tonquellen (Übungsreihe zum maschinellen Lernen), der mit Python gelernt wurde
Die Geschichte der numerischen Berechnung von Differentialgleichungen mit TensorFlow 2.0
[Python] Verschiedene Datenverarbeitung mit Numpy-Array
UnicodeEncodeError hat Probleme mit der Standardausgabe von Python3
[Wissenschaftlich-technische Berechnung mit Python] Berechnung des Matrixprodukts mit @ operator, python3.5 oder höher, numpy
Verschiedene Formatspezifikationen der str.format () -Methode von Python3
Zeichnen mit Matrix-Reinventor von Python Image Processing-
Empfehlung von Altair! Datenvisualisierung mit Python
[Python] Verschiedene Kombinationen von Zeichenketten und Werten
Echtzeitberechnung des Durchschnittswertes mit Corroutine