[PYTHON] Statistiques mathématiques des bases Variables probabilistes

Variables probabilistes et dés

Prenons d'abord l'exemple de 1 à 6 dés sans distorsion: game_die:.

Puisque chacun des lancers de dés 1 à 6 est également probable (il n'y a pas de biais dans chaque jet), chaque jet peut être donné avec la probabilité suivante.

$ P (probabilité d'obtenir un 1) = \ frac {1} {6} \ qquad P (probabilité d'obtenir un 2) = \ frac {1} {6} \ qquad P (probabilité d'obtenir un 3) = \ frac {1} {6} \
P (probabilité d'obtenir un 4) = \ frac {1} {6} \ qquad P (probabilité d'obtenir un 5) = \ frac {1} {6} \ qquad P (probabilité d'obtenir un 6) = \ frac {1} {6} $

Si vous définissez ici la variable de probabilité $ X $ comme suit

$ X = \left\{ \begin{array}{ll} 1 & (quand 1 est déployé) \
2 & (quand un 2 rouleau apparaît) \
3 & (quand 3 rouleaux) \
4 & (quand un 4 est lancé) \
5 & (quand un 5 est lancé) \
6 & (quand un 6 est obtenu) \
\end{array}\right. $

Ce sera. Une variable qui fluctue de manière probabiliste, comme ici $ X $, est appelée une ** variable probabiliste **. La valeur réellement prise par la variable de probabilité est ici appelée la ** valeur réalisée **.

$ P(X = x) = \frac{1}{6}, \qquad x = 1,2,3,4,5,6 $

Lançons réellement les dés avec python.

import numpy as np
import matplotlib as mpl

np.random.seed()

prob_dice = np.array([])
dice = np.array([1,2,3,4,5,6])
dice_data = np.random.choice(dice, dice_times)
dice_times = 10000

for i in range(1,7):
    p = len(dice_data[dice_data == i]) / dice_times
    print(i, "Probabilité de", p)
    prob_dice = np.append(prob_dice, len(dice_data[dice_data == i]) / dice_times)
    
plt.bar(dice, prob_dice)
plt.grid(True)

Voici le résultat. Cette fois, nous avons lancé les dés 10 000 fois et calculé la probabilité. Comme le montrent les résultats, chaque œil est proche de $ \ frac {1} {6} = 0,1666 ... $.

image.png

Fonction de probabilité et fonction de distribution cumulative

Il existe différentes variables stochastiques, et $ X $ est une ** variable probabiliste discrète ** lorsque les valeurs possibles de $ X $ sont finies ou infinies (1, 2, 3, 4, Cela signifie une valeur qui est discrète comme 5 ...), et $ X $ est une ** variable de probabilité continue ** lorsqu'elle a une fonction de densité. Dans le cas d'une probabilité discrète, la probabilité est considérée pour chaque $ x $ comme dans les dés précédents, et la fonction de $ x $ est appelée ** fonction de probabilité ** et peut être exprimée comme suit.

$ p(x) = P(X = x)\
$

De plus, la fonction de probabilité a les propriétés suivantes. Notez que $ \ sum $ représente ici la somme des probabilités.

$ p(x) \ge 0, \qquad \forall x \
\sum_{x}^{} p(x) = 1 $

La somme des sommes cumulées des fonctions de probabilité est appelée la ** fonction de distribution cumulative ou fonction de distribution **. La fonction de distribution a les propriétés suivantes, telles que la monotonie et la continuité droite.

$ F(x) = P(X \le x) = \sum_{y \le x} p(y)\
(1) \quad \lim_{n \to -\infty}F(x) = 0\
(2) \ quad \ forall x, y \ in \ mathbb {R} (nombre réel) \
\qquad F(x) \ge F(y), \quad F(x) = \lim_{\varepsilon \to 0}F(x + \varepsilon)\
(3) \quad \lim_{n \to +\infty}F(x) = 1 $

Ici, dans $ \ forall x $, $ F (X) $ est continu à droite (exprimé comme $ F (X +) = F (X) $), et $ x_n $ est une suite de nombres qui décroît de manière monotone et converge. $ \ lim_ {x_n \ to + \ infty} F (x_n) = F (x) $. Ici, $ x + $ indique qu'il décroît de manière monotone à partir de la direction positive et converge vers $ x $. Ensuite, la fonction stochastique peut être obtenue en prenant la différence entre les fonctions de distribution cumulative de $ X $ comme indiqué ci-dessous.

$ p(x) = F(x) - \lim_{x_n \to x-} F(x_n) = F(x) - F(x-) $

Si vous implémentez la distribution cumulative en python, ce sera comme suit.

import numpy as np
import matplotlib as mpl
from scipy.stats import norm
import matplotlib.pyplot as plt

x = np.arange(0,3000)
y = norm.cdf(x, loc=1500, scale=500)

plt.plot(x,y)
plt.grid(True)
plt.xlabel("value")
plt.ylabel("possibility")

コメント 2020-01-31 151132.png

Recommended Posts

Statistiques mathématiques des bases Variables probabilistes
Apprendre en profondeur à partir des bases mathématiques Partie 2 (pendant la fréquentation)
Apprenez les bases en touchant les variables python
Obtenir des statistiques, etc. à partir de l'échantillon extrait
Apprentissage profond à partir des bases mathématiques (pendant la fréquentation)
[Introduction aux data scientists] Bases de la probabilité et des statistiques ♬ Variable de probabilité / probabilité et distribution de probabilité
[Revue statistique] Quatre règles de variables stochastiques
Accédez aux variables définies dans le script depuis REPL
Ce à quoi j'ai pensé dans la question de l'examen d'entrée de "Bayes Statistics from the Basics"
Compréhension mathématique de l'analyse en composantes principales depuis le début
[Bases des statistiques mathématiques modernes avec python] Chapitre 1: Probabilité
Apprendre des bases Manuel sur l'intelligence artificielle Chapitre 5 Problèmes de fin de chapitre
[Statistiques pour les programmeurs] Variables de probabilité, distributions de probabilité et fonctions de densité de probabilité