[PYTHON] Poisson-Regressionsanalyse

Poisson-Regressionsanalyse

Die Poisson-Regressionsanalyse ist auch eine nichtlineare Regressionsanalyse. Die Verteilungsfunktion kann durch das wahrscheinlichste Schätzverfahren unter Annahme einer Poisson-Verteilung geschätzt werden. Diese Analysemethode ist im Grunde ein Ansatz, der für diejenigen verwendet werden kann, deren abhängige Variable "Zähldaten" ist. Außerdem muss die abhängige Variable eine Ganzzahl größer oder gleich 0 sein. Das Folgende sind typische Beispiele für die Poisson-Regressionsanalyse, die verwendet werden können. ex) Anzahl der Verkehrsunfälle, Anzahl der Besucher, Anzahl der Kinder ... Bitte beachten Sie, dass Sie die falsche Analyse erhalten, wenn Sie es nur verwenden, weil die Distribution wie eine Poisson-Distribution aussieht.

Theorie der Poisson-Regressionsanalyse

Die Verteilungsfunktion einer typischen Poisson-Verteilung ist wie folgt. $ \frac{\lambda^s exp(-\lambda)}{s!}$

In der Poisson-Regressionsanalyse wird das folgende Modell platziert. E[y_i|X_i]=exp(X\beta) = \lambda

Als nächstes finden Sie $ P (y_i | X_i) $. P(y_i|X_i) = \frac{exp(X\beta)^{y_i} exp[exp(X\beta)]}{y_i!}

Als nächstes finden Sie die Wahrscheinlichkeitsfunktion. $L(\beta)=\Pi P(y_i|X_i) $ Die wahrscheinlichste Schätzung hierfür kann nicht von Hand berechnet werden. Bitten Sie daher die Optimierungsfunktion, diese zu berechnen.

Effekt der Poisson-Regressionsanalyse

Berechnung des Randeffekts von $ E [y_i | X_i] = exp (X \ beta) $ \frac{\partial E[y_i|X_i] }{\partial X} = \beta exp(X\beta)=\beta \bar{y}

Python-Code

import statsmodels.api as sm
import pandas as pd
#read data
data=pd.read_csv("___.csv")
target=data.loc[:,"name"]
explain=data.loc[:,["names"]]

#it is necessary to add constant variable
explain=sm.add_constant(explain)

model=sm.Poisson(target, explain)
result=model.fit()
#you can get beta but not Partial effect
print(result.summary())

#you can get Partial Effect!!
print(result.get_margeff(at="overall").summary())
#if you change [at="overall"], the way of calculation can be change 

Recommended Posts

Poisson-Regressionsanalyse
Methode der Regressionsanalyse
Grundlagen der Regressionsanalyse
Führen Sie eine Regressionsanalyse mit NumPy durch
Regressionsanalyse mit Python
Was ist eine logistische Regressionsanalyse?
Multiple Regressionsanalyse mit Keras
Einfache Regressionsanalyse mit Python
Erste einfache Regressionsanalyse in Python
Algorithmus für maschinelles Lernen (multiple Regressionsanalyse)
Algorithmus für maschinelles Lernen (Einzelregressionsanalyse)
Datenanalyse zur Verbesserung von POG 3 ~ Regressionsanalyse ~
Einfache Implementierung einer Regressionsanalyse mit Keras
Was ist eine mehrjährige logistische Regressionsanalyse?
Logistische Regressionsanalyse Selbst erstellt mit Python
Ich habe eine multiple Regressionsanalyse mit Polypoly-Regression versucht
Logistische Rückgabe
Maschinelles Lernen mit Python (2) Einfache Regressionsanalyse
Logistische Rückgabe
Lineare Regression
Parabolische Analyse
Einfache Regressionsanalyse nach der Methode der kleinsten Quadrate
Zeitreihenanalyse Nr. 6 Gefälschte Rückkehr und republikanischer Teil
[Maschinelles Lernen] Regressionsanalyse mit Scicit Learn
[scikit-learn, matplotlib] Multiple Regressionsanalyse und 3D-Zeichnung
Erstellen Sie ein Multi-Output-Modell für die Regressionsanalyse [Anfänger]
Einfache LASSO-Regressionsanalyse mit Python (keine Theorie)