Die Poisson-Regressionsanalyse ist auch eine nichtlineare Regressionsanalyse. Die Verteilungsfunktion kann durch das wahrscheinlichste Schätzverfahren unter Annahme einer Poisson-Verteilung geschätzt werden. Diese Analysemethode ist im Grunde ein Ansatz, der für diejenigen verwendet werden kann, deren abhängige Variable "Zähldaten" ist. Außerdem muss die abhängige Variable eine Ganzzahl größer oder gleich 0 sein. Das Folgende sind typische Beispiele für die Poisson-Regressionsanalyse, die verwendet werden können. ex) Anzahl der Verkehrsunfälle, Anzahl der Besucher, Anzahl der Kinder ... Bitte beachten Sie, dass Sie die falsche Analyse erhalten, wenn Sie es nur verwenden, weil die Distribution wie eine Poisson-Distribution aussieht.
Die Verteilungsfunktion einer typischen Poisson-Verteilung ist wie folgt. $ \frac{\lambda^s exp(-\lambda)}{s!}$
In der Poisson-Regressionsanalyse wird das folgende Modell platziert.
Als nächstes finden Sie $ P (y_i | X_i) $.
Als nächstes finden Sie die Wahrscheinlichkeitsfunktion. $L(\beta)=\Pi P(y_i|X_i) $ Die wahrscheinlichste Schätzung hierfür kann nicht von Hand berechnet werden. Bitten Sie daher die Optimierungsfunktion, diese zu berechnen.
Berechnung des Randeffekts von $ E [y_i | X_i] = exp (X \ beta) $
import statsmodels.api as sm
import pandas as pd
#read data
data=pd.read_csv("___.csv")
target=data.loc[:,"name"]
explain=data.loc[:,["names"]]
#it is necessary to add constant variable
explain=sm.add_constant(explain)
model=sm.Poisson(target, explain)
result=model.fit()
#you can get beta but not Partial effect
print(result.summary())
#you can get Partial Effect!!
print(result.get_margeff(at="overall").summary())
#if you change [at="overall"], the way of calculation can be change
Recommended Posts