Python: Zeitreihenanalyse: Konstanz, ARMA / ARIMA-Modell

Konstanz

Was ist stationär

Ein sehr wichtiges Konzept in der Zeitreihenanalyse ist stationär. Es repräsentiert die Natur des stochastischen Prozesses, dass sich seine stochastische Verteilung nicht mit der Zeit oder Position ändert.

Einfach ausgedrückt

Mit einem konstanten Wert als Achse unabhängig vom Zeitablauf

Es schwingt und ändert sich mit der gleichen Breite

Zeitreihendaten können als stationär bezeichnet werden. Es gibt viele Formeln, aber was die Formel selbst bedeutet Achten wir auf die Form des Diagramms und verstehen es.

Schwache Beständigkeit / starke Beständigkeit

Für Stabilität

Es wird in zwei Typen eingeteilt: schwach stationär und stark stationär.

In Zukunft wird sich die Zeitreihendatenanalyse hauptsächlich mit schwachen stationären Daten befassen, also einfach Wenn wir über Beständigkeit sprechen, denken Sie an schwache Beständigkeit.

Schwach stabil bedeutet, dass der erwartete Wert und die Selbstkovarianz von Zeitreihendaten über die Zeit konstant sind. Was ist selbstverteilt? Mit sich selbst verteilt, der t Stunden (Zeit) vom gegenwärtigen Selbst entfernt ist Wie viel Variation gibt es zwischen den beiden.

Der Mittelwert sei μ und die k-dimensionale Selbstkovarianz sei γk

image.png

Es wird ausgedrückt als. Die Tatsache, dass der erwartete Wert konstant ist, bedeutet, dass er unabhängig vom Zeitablauf um einen konstanten Wert schwankt. Weil die konstante Selbstkovarianz bedeutet, dass die Variation der Daten konstant ist. Es zeigt, dass es mit der gleichen Breite schwingt und sich ändert.

weißes Rauschen

An allen Punkten t

image.png

Wenn dies zutrifft, wird eine solche Zeitreihe als weißes Rauschen bezeichnet.

Es hat eine schwache Beständigkeit basierend auf der obigen Definition. Die obige Formel zeigt, dass der erwartete Wert des weißen Rauschens & epsi; t zu jedem Zeitpunkt t 0 ist. In der folgenden Formel ist die Streuung des weißen Rauschens unabhängig von der Zeit konstant. Dies bedeutet, dass die Kovarianz 0 ist, dh keine Autokorrelation aufweist.

Weißes Rauschen ist für das unregelmäßige Variationsmuster (Fehler) im Zeitreihenmodell verantwortlich. Da die unregelmäßige Schwankung selbst mathematisch schwer zu reproduzieren ist, wird weißes Rauschen verwendet.

import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import numpy as np
from pandas import datetime


#Einstellung für weißes Rauschen
mean = 0
std = 1 
num_samples = 1000
samples = np.random.normal(mean, std, size=num_samples)
#Plot für weißes Rauschen
plt.title("Whitenoise")
plt.plot(samples)
plt.show()

Bestätigung der Beständigkeit

Warum Stabilität wichtig ist

Warum ist es wichtig, nachdem Sie etwas über Konstanz gelernt haben?

Aufgrund der Analyse instationärer Daten in Zeitreihendaten ist dies völlig bedeutungslos. Dies liegt daran, dass es möglich ist, eine Korrelation zu erkennen (eine Beziehung, in der B steigt oder fällt, wenn A steigt).

Zeitreihendaten sind Daten, die sich im Laufe der Zeit ändern.
Der gemeinsame Punkt "Zeitablauf" schafft eine bedeutungslose Korrelation.
(Eine solche bedeutungslose Korrelation wird als Pseudokorrelation bezeichnet.)

Zum Beispiel wurde ein Mann geboren Ich habe 20 Jahre lang zugenommen, bis ich 20 Jahre alt bin. Auf der anderen Seite ist Chinas BIP, das sich in den letzten Jahren bemerkenswert entwickelt hat, seit etwa 1994 seit 20 Jahren gestiegen.

Zu diesem Zeitpunkt ist es bedeutungslos zu sagen, dass "Chinas BIP gestiegen ist, weil ich zugenommen habe".

Um eine solche bedeutungslose Korrelation von Zeitreihendaten nicht zu erkennen Führen Sie für eine Zeitreihe ohne Konstanz eine Konvertierung durch, z. B. eine Differenz, um eine Zeitreihe mit Konstanz zu erstellen. Wir müssen mit der Analyse fortfahren.

Bestätigung der Beständigkeit (Visualisierung)

Der effektivste Weg, um festzustellen, ob eine Zeitreihe stationär ist, besteht darin, sie tatsächlich zu beobachten.

Die Datenvisualisierung ist die Grundlage der Zeitreihenanalyse oder genauer der Datenanalyse.

Wie oben erwähnt, sind konstante Zeitreihendaten unabhängig vom Zeitablauf verfügbar. Sie schwankt mit der gleichen Breite um einen bestimmten Wert Es gibt eine Funktion.

ARMA / ARIMA-Modell

Was ist das ARMA-Modell?

Grundmodell zur Analyse univariater Zeitreihendaten Mit ARMA-Modell Erfahren Sie mehr über das ARIMA-Modell

Es ist eine entwickelte Form Modellieren Sie Zeitreihendaten mit dem SARIMA-Modell (Salima).

Wie der Name schon sagt, wird das ARMA-Modell später beschrieben. Es ist ein Modell, das das AR-Modell und das MA-Modell kombiniert.

Das ARMA-Modell ist nicht nur ein SARIMA-Modell, sondern auch ein anderes Es ist die Basis eines sich entwickelnden Modells und sehr wichtig.

MA-Modell

Das MA-Modell (gleitendes Durchschnittsmodell) verwendet weißes Rauschen als εt

image.png

Es ist ein Modell ausgedrückt als. (Im Falle eines primären Prozesses) Was ist weißes Rauschen?

image.png

Es war eine Zeitreihe, die sich zusammensetzte.

Dieses Modell ist eine Erweiterung des weißen Rauschens. Im Vergleich zu dem an einer Stelle verschobenen Wert

image.png

Da εt-1 ein gemeinsamer Teil ist, hat es eine Autokorrelation. Und dieses MA-Modell Ein Modell, das von früheren Fehlern und vom Fehler der vorherigen q-Werte betroffen ist, wird als MA (q) bezeichnet.

image.png

Das MA (q) -Modell hat q gemeinsame Teile in yt und yt-1. aus diesem Grund

Es hat die Eigenschaft, eine Autokorrelation bis zur q-Periode und keine Autokorrelation mit den Daten vor der q + 1-Periode zu haben.

AR-Modell

Das AR-Modell (Self-Return-Modell) ist ein Modell, bei dem sich der Wert regelmäßig ändert.

image.png

Es ist ein Modell ausgedrückt als. Auf diese Weise soll yt durch yt-1 dargestellt werden, das vorübergehend davon versetzt ist Dort wird die Autokorrelation ausgedrückt. Das AR-Modell ist ein Modell, das den Wert zu einem bestimmten Zeitpunkt rekursiv aus dem vergangenen Wert schätzt. Ein Modell, das den nächsten Wert unter Verwendung der vorherigen p-Werte vorhersagt, wird als AR (p) ausgedrückt.

ARMA-Modell

Das AR-Modell und das MA-Modell haben nicht die Eigenschaft, miteinander zu konkurrieren. Daher ist es möglich, durch Kombinieren dieser beiden zu formulieren. Wenn das AR-Modell von AR (p) und das MA-Modell von MA (q) kombiniert werden, kann es als ARMA (p, q) ausgedrückt werden.

Das AR-Modell ist ein Modell, das den Wert zu einem bestimmten Zeitpunkt rekursiv aus dem vergangenen Wert schätzt.
Das MA-Modell ist ein Modell mit der Eigenschaft, dass eine Korrelation besteht, einfach weil es einen gemeinsamen Teil mit Ausdrücken mit unterschiedlichen Zeitreihen hat.

ARIMA-Modell

Das ARIMA-Modell ist eine Anpassung der Originalserie an die Differenzserie zum zuvor erwähnten ARMA-Modell. Das ARMA-Modell kann zwar nur an stationäre Prozesse angepasst werden Das ARIMA-Modell kann auch auf instationäre Prozesse angewendet werden (Prozesse, bei denen die Mittelung und Streuung von Daten zeitabhängig ist).

ARIMA-Modell, das mit ARMA (p, q) erstellt wurde, wenn die Differenz von vor d Zeit genommen wird Es wird als ARIMA (p, d, q) ausgedrückt. In diesem ARIMA-Modell

・ P ist der Grad der Autokorrelation

· Induziert

・ Q ist ein gleitender Durchschnitt

Wird genannt.

Recommended Posts

Python: Zeitreihenanalyse: Konstanz, ARMA / ARIMA-Modell
Zeitreihenanalyse 2 Stabilität, ARMA / ARIMA-Modell
Python: Zeitreihenanalyse
Python: Zeitreihenanalyse: Erstellen eines SARIMA-Modells
Python: Zeitreihenanalyse: Vorverarbeitung von Zeitreihendaten
Ich habe versucht, Zeitreihen zu analysieren! (AR-Modell)
Zeitreihenanalyse Teil 2 AR / MA / ARMA
Zeitreihenanalyse 4 Konstruktion des SARIMA-Modells
[Statistik] [Zeitreihenanalyse] Zeichnen Sie das ARMA-Modell und erfassen Sie die Tendenz.
Python-Zeitreihenfrage
RNN_LSTM1 Zeitreihenanalyse
Zeitreihenanalyse 1 Grundlagen
Einführung in die Zeitreihenanalyse ~ Saisonales Anpassungsmodell ~ In R und Python implementiert
Python 3.4 Windows7-64bit-Umgebung erstellen (für die Analyse finanzieller Zeitreihen)
Passend zu ARMA, ARIMA Modell
Zeitreihenanalyse Teil 4 VAR
Zeitreihenanalyse Teil 3 Prognose
[Python] Zeichnen Sie Zeitreihendaten
Zeitreihenanalyse Teil 1 Autokorrelation
Umsatzprognose für die Zeitreihenanalyse
Zeitreihenplot gestartet ~ Python Edition ~
Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Zeitreihenanalyse durch allgemeines Gaußsches Zustandsraummodell unter Verwendung von Python [Implementierungsbeispiel unter Berücksichtigung von Extrinsik und Saisonalität]
[Python] Beschleunigt das Laden von Zeitreihen-CSV
Zeitreihenanalyse Nr. 6 Gefälschte Rückkehr und republikanischer Teil
Holen Sie sich mit Python Zeitreihendaten von k-db.com
Zeitvariationsanalyse von Schwarzen Löchern mit Python
Überlebensanalyse mit Python 2-Kaplan-Meier-Schätzung
Ich habe versucht, "Grundlagen der Zeitreihenanalyse und des Zustandsraummodells" (Hayamoto) mit Pystan zu implementieren
[Einführung in die Elementzerlegung] Lassen Sie uns Zeitreihenanalysemethoden in R und Python arrange anordnen
Datenanalyse Python
Zeitreihenzerlegung
Python-Zeitmessung
Erster Python
[CovsirPhy] COVID-19 Python-Paket für die Datenanalyse: SIR-F-Modell
[CovsirPhy] COVID-19 Python-Paket für die Datenanalyse: SIR-Modell
[Zeitreihen mit Handlung] Dynamische Visualisierung mit Handlung [Python, Aktienkurs]
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen