[PYTHON] [Statistik] Visualisierung zum Verständnis des generalisierten linearen gemischten Modells (GLMM).

** "Einführung in die statistische Modellierung für die Datenanalyse" ** (allgemein bekannt als Midoribon) auf S. 157 wird die Idee des "Mischens von Verteilungen" anhand von Zufallszahlen simuliert, anstatt anhand von Verteilungen zu denken, und mit Animation visualisiert Ich habe es versucht, deshalb möchte ich es vorstellen.

Hier ist die resultierende Animation. Ich werde diesen Inhalt im Text erklären. mix_poisson_norm.gif (Der Code lautet hier)

Alle detaillierten Erklärungen sind in diesem "Midoribon" leicht verständlich geschrieben, daher werden wir hier nur erklären, wie man es visualisiert. Wenn Sie denken, dass es interessant klingt, kaufen Sie es bitte!

Vorwort

In einer Pflanze werden maximal 8 Samen produziert, und die Anzahl der überlebenden Samen ist die Binomialverteilung.

p(y_i) ={8 \choose y_i}\ q_i^{y_i} (1-q_i)^{8-y_i} \quad \mbox{for}\ q_i=0,1,2,\dots,8

Angenommen, Sie folgen. $ y_i $ ist die Anzahl der überlebenden Samen (beobachteter Wert) eines einzelnen $ i $, und $ q_i $ ist die Überlebenswahrscheinlichkeit pro Samen in einem einzelnen $ i $.

Nehmen Sie auch an, dass dieses $ q_i $ individuelle Unterschiede aufweist, die von Individuum zu Individuum unterschiedlich sind und durch eine logistische Funktion dargestellt werden.

q_i = {\rm logistic} (r_i)= {1 \over 1 + \exp( -r_i) }

Wir nehmen auch an, dass das Argument $ r_i $ dieser logistischen Funktion einer Normalverteilung mit einem Mittelwert von 0 und einer Standardabweichung von $ s $ folgt.

r_i \sim N(0, s)

Das heißt, die Dichtefunktion von $ r_i $ ist

p(r_i | s) = {1 \over \sqrt{2\pi s^2} } \exp \left( -{r_i^2 \over 2s^2} \right)

Und dies wird als der individuelle Unterschied des einzelnen $ i $ angesehen.

Lassen Sie es uns visualisieren.

Zunächst wird der individuelle Unterschied $ r_i \ sim N (0, s) $ dargestellt. Generierte 10000 Zufallszahlen, die der Normalverteilung folgen, wenn die Standardabweichung $ s = 4 $ beträgt. Das Histogramm ist der hellblaue Balken darunter. Logistische Funktion, bei der jede dieser Funktionen durch eine rote Linie dargestellt wird

q_i = {\rm logistic} (r_i)= {1 \over 1 + \exp( -r_i) }

Konvertiert in einen Wert von 0 bis 1, dh einen Wert, der als Wahrscheinlichkeit angesehen werden kann, dh $ q_i $.

norm_logistic-compressor.png

Da jede dieser normalen Zufallszahlen in die Wahrscheinlichkeit $ q_i $ umgewandelt werden könnte, ist das Folgende eine Darstellung davon als Histogramm von $ q_i $. Es ist eine relativ breite Normalverteilung, und Sie können sehen, dass sie aufgrund der Konvertierung mit einer logistischen Funktion näher an 0 und 1 liegt. hist_of_q-compressor.png

Stellen Sie also für jede dieser 10000 $ q_i $ eine entsprechende Binomialverteilung her. Die Binomialverteilung ist

p(y_i) ={8 \choose y_i}\ q_i^{y_i} (1-q_i)^{8-y_i} \quad \mbox{for}\ q_i=0,1,2,\dots,8

Die Form ist also für jedes $ q_i $ unterschiedlich. Hier ist ein Beispiel für 9 Werte, wobei $ q_i $ "[0,0, 0,125, 0,25, 0,375, 0,5, 0,625, 0,75, 0,875, 1,0]" ist.

various_binomial-compressor.png

Generieren Sie wie oben beschrieben eine große Anzahl von Binomialverteilungen mit dem Wert 10000 $ q_i $ und addieren Sie diese. Hier ist das Ergebnis der Addition.

sum_of_binom-compressor.png

Versuche zu animieren

Im vorherigen Abschnitt habe ich versucht, das Beispiel von $ s = 4 $ grafisch darzustellen, aber ich habe auch die Animation veröffentlicht, wie sich $ s $ kontinuierlich von 0 auf 3 bewegt (siehe Grafik unten). Werden. In diesem Beispiel scheint sich die Verteilung von etwa $ s = 2 $ nach links und rechts zu verschieben.

mix_poisson_norm.gif

Nachschlagewerk

Eine Einführung in die statistische Modellierung für die Datenanalyse    http://hosho.ees.hokudai.ac.jp/%7Ekubo/ce/IwanamiBook.html

Recommended Posts

[Statistik] Visualisierung zum Verständnis des generalisierten linearen gemischten Modells (GLMM).
Einführung in das Generalized Linear Model (GLM) von Python