Daten ohne Kontext sind nur eine Liste von Zahlen. Um die vorliegenden Daten gut nutzen zu können, ist es notwendig, eine breite Palette von Informationen zu sammeln, beispielsweise den Mechanismus des Phänomens hinter den Daten, den historischen Hintergrund und die Umgebung. Sammeln Sie dann basierend auf diesen Informationen mehr Daten mit kostenlosen Ideen.
Daten sind nicht nur durch Sammeln sinnvoll. Die Eigenschaften können durch Vergleichen gesehen werden. Die Berechnung des Mittelwerts oder der Varianz wird als Abrufen einer zusammenfassenden Statistik bezeichnet. Zusätzlich werden ein Frequenzdiagramm und ein Liniendiagramm gezeichnet, um die Daten zu visualisieren und die Eigenschaften der Daten zu erfassen.
Wenn mit einer solchen Analysemethode das Gesamtbild des Phänomens sichtbar wird, wird schließlich die statistische Methode angewendet. In diesem Fall muss der Zweck der Analyse klar sein. groß
Um den Vergleich zu ergänzen, erfordert der Vergleich einige Kriterien. Es gibt zwei Möglichkeiten, dies zu tun. Eine besteht darin, diesen Standard von außen zu suchen. Dies ist ein Vergleich mit dem wahren Modell. Das ist aber fast unmöglich. Vergleichen Sie es daher mit den vorliegenden Daten. Dies entspricht der Verwendung einer t-Verteilungs- oder Dispersionsanalyse.
Der Begriff Modell ist bereits aufgetaucht, aber kurz gesagt handelt es sich um eine Wahrscheinlichkeitsverteilung. Dies ist eine der Methoden zum Ausdrücken eines stochastischen Phänomens und drückt aus, wie ein Phänomen mit einer bestimmten Wahrscheinlichkeit auftritt. Es ist jedoch selten, dass das tatsächliche Phänomen einer solchen Wahrscheinlichkeitsverteilung folgt. Dies liegt daran, dass die Phänomene, die Sie tatsächlich sehen, je nach Situation leicht unterschiedlich sind. Die Daten können auch beobachtetes Rauschen enthalten. Betrachten Sie daher ein bedingtes Verteilungsmodell. Und der Vertreter eines solchen Modells ist die Regressionsanalyse. Es gibt viele Bibliotheken in Statistikmodellen, die für eine solche Analyse geeignet sind.
Lineare Regressionsmodelle in Statistikmodellen
japanisch | statsmodels |
---|---|
Minimum-Quadrat-Methode | OLS |
Gewichtete Methode der kleinsten Quadrate | WLS |
Verallgemeinerte Minimum-Square-Methode | GLS |
Rekursive Methode der kleinsten Quadrate | Recursive LS |
Es wird nach vier Methoden geschätzt. $ x $ ist die erklärende Variable und $ e $ ist der Fehler. $ y $ ist die abhängige Variable und wird als lineare Kombination von $ x $ modelliert. Damit das nach der Methode der kleinsten Quadrate erhaltene Modell plausibel ist, ist der Fehler
Wird auferlegt. GLS ist ein Modell, das sich mit Dispersionsinhomogenität befassen kann, bei der die Streuung von Fehlern nicht konstant ist, und Fehler mit Autokorrelation, bei denen Fehler korreliert sind. WLS befasst sich mit Dispersionsinhomogenität, und rekursives LS ist ein Fehler mit Autokorrelation. Beschäftigt sich mit. Diese Modelle nehmen verschiedene Anpassungen am Problem von Fehlern vor, die die Bedingungen nicht erfüllen, und schätzen den Regressionskoeffizienten, indem sie diese Bedingungen erfüllen.
Wenn wir lineare Regression sagen
Darüber hinaus gibt es ein verallgemeinertes lineares Modell, in dem die Verteilung von $ y $ als Exponentialverteilungsfamilie angegeben ist und der Rest eine beliebige Verteilung ist. Als Weiterentwicklung davon
und so weiter. OLS wird für die lineare Regression verwendet, aber der Regressionskoeffizient wird unter Verwendung der wahrscheinlichsten Methode oder einer Methode geschätzt, die dem verallgemeinerten linearen Modell und seiner Entwicklung ähnlich ist.
Recommended Posts