[PYTHON] Mathematische Statistik aus den Grundlagen Probabilistische Variablen

Probabilistische Variablen und Würfel

Betrachten wir zunächst das Beispiel von 1 bis 6 Würfeln ohne Verzerrung: game_die :.

Da die Würfelwürfe 1 bis 6 gleich wahrscheinlich sind (es gibt keine Verzerrung in ihrem Aussehen), kann jeder Wurf mit der folgenden Wahrscheinlichkeit gegeben werden.

$ P (Wahrscheinlichkeit, eine 1 zu erhalten) = \ frac {1} {6} \ qquad P (Wahrscheinlichkeit, eine 2 zu bekommen) = \ frac {1} {6} \ qquad P (Wahrscheinlichkeit, eine 3 zu bekommen) = \ frac {1} {6} \
P (Wahrscheinlichkeit, eine 4 zu bekommen) = \ frac {1} {6} \ qquad P (Wahrscheinlichkeit, eine 5 zu bekommen) = \ frac {1} {6} \ qquad P (Wahrscheinlichkeit, eine 6 zu bekommen) = \ frac {1} {6} $

Wenn Sie hier die Wahrscheinlichkeitsvariable $ X $ wie folgt definieren

$ X = \left\{ \begin{array}{ll} 1 & (wenn 1 ausrollt) \
2 & (wenn ein 2er Wurf erscheint) \
3 & (wenn 3 Rollen) \
4 & (wenn eine 4 gewürfelt wird) \
5 & (wenn eine 5 gewürfelt wird) \
6 & (wenn eine 6 gewürfelt wird) \
\end{array}\right. $

Es wird sein. Eine Variable, die probabilistisch schwankt, wie hier $ X $, wird als ** probabilistische Variable ** bezeichnet. Der Wert, den die Wahrscheinlichkeitsvariable hier tatsächlich annimmt, wird als ** realisierter Wert ** bezeichnet.

$ P(X = x) = \frac{1}{6}, \qquad x = 1,2,3,4,5,6 $

Lassen Sie uns tatsächlich mit Python würfeln.

import numpy as np
import matplotlib as mpl

np.random.seed()

prob_dice = np.array([])
dice = np.array([1,2,3,4,5,6])
dice_data = np.random.choice(dice, dice_times)
dice_times = 10000

for i in range(1,7):
    p = len(dice_data[dice_data == i]) / dice_times
    print(i, "Wahrscheinlichkeit von", p)
    prob_dice = np.append(prob_dice, len(dice_data[dice_data == i]) / dice_times)
    
plt.bar(dice, prob_dice)
plt.grid(True)

Das Folgende ist das Ergebnis. Dieses Mal haben wir 10.000 Mal gewürfelt und die Wahrscheinlichkeit berechnet. Wie die Ergebnisse zeigen, liegt jedes Auge in der Nähe von $ \ frac {1} {6} = 0,1666 ... $.

image.png

Wahrscheinlichkeitsfunktion und kumulative Verteilungsfunktion

Es gibt verschiedene Arten von Wahrscheinlichkeitsvariablen, und $ X $ ist eine ** diskrete Wahrscheinlichkeitsvariable **, wenn die möglichen Werte von $ X $ endlich oder unendlich sind (1, 2, 3, 4, Es bedeutet einen Wert, der wie 5 ...) gestreut ist, und $ X $ ist eine ** kontinuierliche Wahrscheinlichkeitsvariable **, wenn es eine Dichtefunktion hat. Im Fall einer diskreten Wahrscheinlichkeit wird die Wahrscheinlichkeit für jedes $ x $ wie in den vorherigen Würfeln berücksichtigt, und die Funktion von $ x $ heißt ** Wahrscheinlichkeitsfunktion ** und kann wie folgt ausgedrückt werden.

$ p(x) = P(X = x)\
$

Zusätzlich hat die Wahrscheinlichkeitsfunktion die folgenden Eigenschaften. Beachten Sie, dass $ \ sum $ hier die Summe der Wahrscheinlichkeiten darstellt.

$ p(x) \ge 0, \qquad \forall x \
\sum_{x}^{} p(x) = 1 $

Die Summe der kumulativen Summen der Wahrscheinlichkeitsfunktionen wird als ** kumulative Verteilungsfunktion oder Verteilungsfunktion ** bezeichnet. Die Verteilungsfunktion hat die folgenden Eigenschaften, wie Monotonie und Rechtskontinuität.

$ F(x) = P(X \le x) = \sum_{y \le x} p(y)\
(1) \quad \lim_{n \to -\infty}F(x) = 0\
(2) \ quad \ forall x, y \ in \ mathbb {R} (reelle Zahl) \
\qquad F(x) \ge F(y), \quad F(x) = \lim_{\varepsilon \to 0}F(x + \varepsilon)\
(3) \quad \lim_{n \to +\infty}F(x) = 1 $

Hier ist in $ \ forall x $ $ F (X) $ rechts stetig (ausgedrückt als $ F (X +) = F (X) $), und $ x_n $ ist eine Zahlenfolge, die monoton abnimmt und konvergiert. $ \ lim_ {x_n \ bis + \ infty} F (x_n) = F (x) $. Hier zeigt $ x + $ an, dass es aus der positiven Richtung monoton abnimmt und gegen $ x $ konvergiert. Dann kann die stochastische Funktion erhalten werden, indem die Differenz zwischen den kumulativen Verteilungsfunktionen von $ X $ wie unten gezeigt genommen wird.

$ p(x) = F(x) - \lim_{x_n \to x-} F(x_n) = F(x) - F(x-) $

Wenn Sie die kumulative Verteilung in Python implementieren, ist dies wie folgt.

import numpy as np
import matplotlib as mpl
from scipy.stats import norm
import matplotlib.pyplot as plt

x = np.arange(0,3000)
y = norm.cdf(x, loc=1500, scale=500)

plt.plot(x,y)
plt.grid(True)
plt.xlabel("value")
plt.ylabel("possibility")

コメント 2020-01-31 151132.png

Recommended Posts

Mathematische Statistik aus den Grundlagen Probabilistische Variablen
Deep Learning aus den mathematischen Grundlagen Teil 2 (während der Teilnahme)
Lernen Sie die Grundlagen, während Sie Python-Variablen berühren
Erhalten Sie Statistiken usw. aus der extrahierten Probe
Deep Learning aus den mathematischen Grundlagen (während der Teilnahme)
[Einführung in Datenwissenschaftler] Grundlagen der Wahrscheinlichkeit und Statistik ♬ Wahrscheinlichkeits- / Wahrscheinlichkeitsvariable und Wahrscheinlichkeitsverteilung
[Statistikübersicht] Vier Regeln für stochastische Variablen
Greifen Sie über REPL auf die im Skript definierten Variablen zu
Woran ich in der Aufnahmeprüfungsfrage "Bayes Statistics from the Basics" gedacht habe
Mathematisches Verständnis der Hauptkomponentenanalyse von Anfang an
[Grundlagen der modernen mathematischen Statistik mit Python] Kapitel 1: Wahrscheinlichkeit
Lernen aus den Grundlagen Lehrbuch für künstliche Intelligenz Kapitel 5 Kapitelende Probleme
[Statistik für Programmierer] Wahrscheinlichkeitsvariablen, Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichtefunktionen