[PYTHON] [Statistik für Programmierer] Wahrscheinlichkeitsvariablen, Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichtefunktionen

Inhaltsverzeichnis

Statistik für Programmierer - Inhaltsverzeichnis

Was ist eine stochastische Variable?

Eine stochastische Variable ist ein Wert, bei dem Sie den Bereich möglicher Werte kennen, aber nicht wissen, um welchen Wert es sich handelt. Wenn Sie beispielsweise einen Würfel werfen, erhalten Sie 1,2,3,4,5,6 Würfe, und die Würfe 1 bis 6 sind die Wahrscheinlichkeitsvariablen.

In der Formel geschrieben ist es wie folgt.

P(X) = \frac{1}{6} (X = 1, 2, 3, 4, 5, 6)

Zusätzlich kann die Wahrscheinlichkeit eines Ereignisses, bei dem eine 5 durch Würfeln geworfen wird, durch die folgende Formel ausgedrückt werden.

P(5) = \frac{1}{6}

Wahrscheinlichkeitsverteilung

Die Wahrscheinlichkeitsverteilung ist die Verteilung jedes Werts der Wahrscheinlichkeitsvariablen und die Wahrscheinlichkeit, dass der Wert erscheint. Das Beispiel eines Würfels ist beispielsweise wie folgt.

Augen würfeln Wahrscheinlichkeit
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

Diskrete stochastische Variable

Diskrete stochastische Variablen sind stochastische Variablen, die nur diskrete Werte annehmen. Zum Beispiel ist der Würfelwurf 2 nach 1 und 1.1 und 1.2 existieren nicht. Solche Variablen werden diskrete Wahrscheinlichkeitsvariablen genannt. Dinge wie Größe und Gewicht sind kontinuierliche stochastische Variablen.

Diskrete Wahrscheinlichkeitsverteilung

Die Wahrscheinlichkeitsverteilung diskreter Wahrscheinlichkeitsvariablen wird als diskrete Wahrscheinlichkeitsverteilung bezeichnet.

Probabilistische Massenfunktion

Wenn die Wahrscheinlichkeit, dass die diskrete Wahrscheinlichkeitsvariable "x" wird, "f (x)" ist, wird dieses "f (x)" als Wahrscheinlichkeitsmassenfunktion bezeichnet. Da die Wahrscheinlichkeit, dass alle Ereignisse auftreten, 1 ist, gilt auch die folgende Gleichung.

\Sigma_{i=1}^{n} P(x_i) = P(x_1) + P(x_2) +・ ・ ・+ P(x_i) = 1

Ein Beispiel für einen Würfel wäre:

\frac{1}{6} + \frac{1}{6} + \frac{1}{6} + \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = 1

Kontinuierliche Wahrscheinlichkeitsverteilung

Eine kontinuierliche Wahrscheinlichkeitsvariable ist das Gegenteil der oben beschriebenen diskreten Wahrscheinlichkeitsvariablen und weist unzählige Werte zwischen benachbarten Werten wie Größe und Gewicht auf. Beispielsweise gibt es im Fall der Höhe unzählige Werte zwischen 180 cm und 181 cm, wie beispielsweise 180,01 cm, 180,001 cm, 180.0001 cm und so weiter. Die Wahrscheinlichkeitsverteilung solcher kontinuierlichen Wahrscheinlichkeitsvariablen wird als kontinuierliche Wahrscheinlichkeitsverteilung bezeichnet.

Wenn der Bereich der Wahrscheinlichkeitsvariablen vom kontinuierlichen Typ auf 1 bis 6 eingestellt ist, ist die Wahrscheinlichkeit, dass 3 erscheint, nicht "1/6" wie im Fall des diskreten Typs. 3 ist einer von unendlich vielen Werten. In diesem Fall ist die Wahrscheinlichkeit 0`.

P(x) = \frac{1}{\infty} = 0

Wahrscheinlichkeitsdichtefunktion

Im Fall von kontinuierlichen Wahrscheinlichkeitsvariablen beträgt die Wahrscheinlichkeit, dass der Wert einer bestimmten Wahrscheinlichkeitsvariablen angenommen wird, 0, Die Wahrscheinlichkeit, dass eine stetige Variable "X" "a ≤ X ≤ b" ist, wird als Wahrscheinlichkeitsdichte bezeichnet.

Wenn die Wahrscheinlichkeit, dass die kontinuierliche Wahrscheinlichkeitsvariable "X" größer oder gleich "a" und kleiner oder gleich "b" ist, nachstehend berechnet wird, wird "f (x)" als Wahrscheinlichkeitsdichtefunktion bezeichnet. Die Summe der Wahrscheinlichkeiten aller Ereignisse ist "1", also "= 1". Umgekehrt ist alles, was nicht "1" wird, keine Wahrscheinlichkeitsdichtefunktion.

P(a \leq X \leq b) = \int _a ^b f(x) dx = 1

In dieser Formel wird die Fläche im Bereich von a bis b wie in der folgenden Abbildung gezeigt berechnet. Das konstante Integral von "f (x)" von a nach b repräsentiert die Wahrscheinlichkeit, dass X zwischen a und b liegt.

kakuritumitudo.png

Quelle: Schöne Geschichte der Mathematik an der High School

Referenz

Recommended Posts

[Statistik für Programmierer] Wahrscheinlichkeitsvariablen, Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichtefunktionen
[Einführung in Datenwissenschaftler] Grundlagen der Wahrscheinlichkeit und Statistik ♬ Wahrscheinlichkeits- / Wahrscheinlichkeitsvariable und Wahrscheinlichkeitsverteilung
[Statistik für Programmierer] Bedingter Wahrscheinlichkeits- und Multiplikatorsatz
[Statistik für Programmierer] Lorenzkurve und Gini-Koeffizient
[Statistik für Programmierer] Box Whisker
[Statistik für Programmierer] Dispersion, Standardabweichung und Fluktuationskoeffizient
[Statistiken für Programmierer] Durchschnitt, Median und am häufigsten
Tipps zum Ersetzen und Debuggen von Funktionen
Zusammenfassung der Wahrscheinlichkeitsverteilungen, die häufig in Statistiken und Datenanalysen vorkommen
[Statistik für Programmierer] Was ist ein Ereignis?
[Statistik für Programmierer] Inhaltsverzeichnis-Data Science
Mathematische Statistik aus den Grundlagen Probabilistische Variablen
Liste der wichtigsten Wahrscheinlichkeitsverteilungen, die beim maschinellen Lernen und in der Statistik verwendet werden, sowie Code in Python