[PYTHON] Eine Lernmethode für Anfänger zum Erlernen der Zeitreihenanalyse

Bei meiner persönlichen Ingenieurstudiensitzung 2019 Adventskalender "Einführung in die Bayes'sche Statistik für Anfänger in der Statistik" Ich schrieb einen Artikel "Wie man lernt, bis man es tut" und er wurde sehr gut aufgenommen.

Deshalb möchte ich dieses Mal über das Studium für Anfänger in Statistik schreiben, um Zeitreihenanalyse zu lernen.

Zweck und Zielgruppe dieses Artikels

Dieser Artikel soll denjenigen helfen, die die Grundlagen der Statistik in gewissem Maße studiert haben, in der Lage zu sein, lobenswert über das große Thema der Statistik der "Zeitreihenanalyse" zu sprechen.

Ziel dieses Artikels ist es, einen Überblick über die Zeitreihenanalyse zu geben.

Selbst in der Zeitreihenanalyse besteht das Ziel darin, das analytische Modell ** Zustandsraummodell ** verstehen zu können.

Bei den hier vorgestellten Büchern handelt es sich um Bücher, die Sie durch Bewegen der Hände lernen können. Daher sind Programmierkenntnisse unerlässlich.

Was ist Zeitreihenanalyse?

Was sind Zeitreihendaten?

Die Zeitreihenanalyse ist, wie der Name schon sagt, eine Datenreihe, die das Konzept der Zeit beinhaltet.

Die Welt ist voller Zeitreihendaten. Ich frage mich, ob es wirklich keine Daten gibt, die das Konzept der Zeitachse nicht enthalten! ?? Ich denke sogar das. Denn wenn Sie 10.000 Mal würfeln (nicht zu diesem Zeitpunkt), vergeht die Zeit. Es sind jedoch keine Daten in Zeitreihen, die versuchen, die Zeitachse zu ignorieren, wie wenn 10.000 Mal gewürfelt wird.

Ein typisches Beispiel für Zeitreihendaten sind Aktienkurse.

400px-Nikkei_225(1970-).svg.pn g [Nikkei Average Stock Price wikipedia](https://ja.wikipedia.org/wiki/%E6%97%A5%E7%B5%8C%E5%B9%B3%E5%9D%87%E6%A0%AA% E4% BE% A1) (Ich kann es visuell fühlen, ** die Zeit des hohen Wirtschaftswachstums ** ...)

Einige Leute denken vielleicht, dass "Zeitreihenanalyse eine Verarbeitung natürlicher Sprache ist !!". Natürlich ist die Verarbeitung natürlicher Sprache aufgrund der jüngsten Entwicklung des maschinellen Lernens eine der auffälligsten Zeitreihenanalysen. Jedermann "Alexa, was ist Zeitreihenanalyse?" Als ich mit dem stilvollen zylindrischen Innenraum sprach, "Wow, !! su !!" Die Antwort ist auf die Entwicklung der Verarbeitungstechnologie für natürliche Sprachen zurückzuführen.

Wir wagen es jedoch nicht, uns hier mit der Verarbeitung natürlicher Sprache zu befassen, sondern nur mit allgemeineren Zeitreihendaten wie Aktienkursen und Verkaufsdaten.

Themen der Zeitreihenanalyse und Zustandsraummodelle

Für das Gesamtbild der Zeitreihenanalyse Dies ist das Buch "Grundlagen der Zeitreihenanalyse und des Zustandsraummodells: Theorie und Implementierung mit R und Stan gelernt", das später vorgestellt wird. Es wird ausführlich in Mr. Babas Blog Logik von Blau beschrieben. (Es ist keine Übertreibung zu sagen, dass der Inhalt dieses Artikels alle im Inhalt dieses Blogs enthalten ist ...)

Das Zustandsraummodell ist grob gesagt eine Art statistisches Modell, das einen unsichtbaren "Zustand" annimmt. Die beobachteten Werte sind nur die Ergebnisse des Staates. Aus dem Zustand x t </ sub> vor dem t-1-Punkt wird der Zustand x t </ sub> am t-Punkt erzeugt. Der beobachtete Wert y t </ sub> wird zu diesem Zeitpunkt t aus dem Zustand x t </ sub> erzeugt.

In Hayashimoto (S.179) oben, am Beispiel des Fischfangs, Die Anzahl der Fische im See an einem Tag ist der Zustand, und die Anzahl der an diesem Tag gefangenen Fische ist der beobachtete Wert.

Wie in diesem Beispiel handelt es sich auch hier um einen Beobachtungswert mit einem Zustand. Da wir den Zustand jedoch nicht kennen, haben wir keine andere Wahl, als aus den beobachteten Werten zu raten.

Es ist ein Thema der Statistik, weil es sich im Gegensatz zu Zustandsraummodellen, dem sogenannten allgemeinen maschinellen Lernen, statistisch mit Zuständen und Beobachtungen befasst.

Es hat eine gewisse Geschichte, aber in den letzten Jahren ist es ein statistisches Modell, über das häufig im Rahmen der Bayes'schen Statistik gesprochen wird. (Informationen zum Studium der Bayes'schen Statistik finden Sie im Artikel am Anfang.)

Studienmethode

Grundlagen der Zeitreihenanalyse

In der Zeitreihenanalyse ist das Zustandsraummodell ein schwieriges Modell, keine "klassische" Methode.

Als Grundlage für die Zeitreihenanalyse wird empfohlen, zunächst "klassische" Methoden wie das ARMA-Modell zu erlernen, um ein Bild zu erhalten.

Es wird empfohlen, eine raue Atmosphäre zu schaffen

51mEuEErMJL.SX352_BO1,204,203,200.jpg

『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識』です。

Die Formeln sind auch einfach, so dass Sie sie schnell lesen und ein Gefühl dafür bekommen können.

Erfassen Sie das Bild des Zustandsraummodells

Wenn Sie ein Gefühl für die Zeitreihenanalyse bekommen, dann Hayato!["Grundlagen der Zeitreihenanalyse und des Zustandsraummodells: Theorie und Implementierung mit R und Stan gelernt"](https://www.amazon.co.jp/ Gehen Sie zu dp / 4903814874 / ref = cm_sw_em_r_mt_dp_U_2qr2EbRBTCTC5).

516f3jVjO2L.SX353_BO1,204,203,200.jpg

Das Tolle an Hayashimoto ist, dass er das Bild des Zustandsraummodells ohne mathematische Formeln erklärt. Dies ist etwas, das wunderbare Bücher über Statistik und maschinelles Lernen gemeinsam haben, aber durch die Kommunikation von Bildern in Worten wird die Theorie, die dazu neigt, trocken zu sein, zum Leben erweckt.

Die Erklärung von Teil 5 des Kalman-Filters und die Glättung mit der wahrscheinlichsten Schätzmethode, die den Höhepunkt dieses Buches darstellt, ist ein Meisterwerk. Schließlich befasst sich Teil 6 auch mit der Schätzung von Zustandsraummodellen durch Bayes'sche Inferenz.

Hayato ist auch enttäuscht von Mr. Babas Fähigkeit zum abstrakten Denken und zur Verbalisierung. Ich würde dich gerne einmal sehen.

Das Zustandsraummodell mathematisch genauer verstehen

Sobald Sie das Zustandsraummodell in Hayashimoto vollständig verstanden haben, gehen wir zur härteren mathematischen Welt über.

EmpfohlenZeitreihenanalyse vom Basics-Kalman-Filter, MCMC, Partikelfilter in R

517UNNmUFtL.SX396_BO1,204,203,200.jpg

Es ist ein so gutes Buch, dass ich nicht verstehe, warum manche Leute es schlecht bewerten. Es kann jedoch eine hohe Hürde für das erste Zustandsraummodell sein. Da die Geschichte von Anfang an in der Bayes'schen Statistik entwickelt wurde, kann es schwierig sein, wenn Sie nicht mit Bayes vertraut sind.

Wenn Sie sich in einem "vollständig verstandenen" Zustand herausfordern, werden Sie in die Welt von "Ich weiß nichts" entführt. Wenn Sie es jedoch mit Hayashimoto hin und her lesen, können Sie das Zustandsraummodell im wahrsten Sinne des Wortes tief verstehen. Rückblickend auf den Kalman-Filter, der in Hayashimoto vom Bayes'schen statistischen Standpunkt dieses Buches gelernt wurde, besteht eine sehr tiefe Verbindung ...

Zusammenfassung

Die Zeitreihenanalyse ist ein wichtiges Thema in der Statistik, aber ich denke, es ist immer noch ein unbekanntes Gebiet. Die Welt ist so voller Zeitreihen. Ist es, weil es schwierig ist?

Der Schlüssel zur Zeitreihenanalyse liegt darin, dass die Zukunft aus der Vergangenheit entsteht. Und die Vergangenheit und die Zukunft sind irgendwie ähnlich.

Es dreht sich um Die Zeiten drehen sich um

Recommended Posts

Eine Lernmethode für Anfänger zum Erlernen der Zeitreihenanalyse
[Für Anfänger] So studieren Sie den Python3-Datenanalysetest
LSTM (1) zur Zeitreihenvorhersage (für Anfänger)
Erkennung von Zeitreihendatenanomalien für Anfänger
Python: Zeitreihenanalyse: Erstellen eines SARIMA-Modells
Verwendung von Datenanalysetools für Anfänger
[Für Anfänger] Wie man Programmierung studiert Private Memo
Python: Zeitreihenanalyse
RNN_LSTM1 Zeitreihenanalyse
Zeitreihenanalyse 1 Grundlagen
Python 3.4 Windows7-64bit-Umgebung erstellen (für die Analyse finanzieller Zeitreihen)
Ich möchte zum ersten Mal eine Django-Studie zur Mittagsdatenbank [EP1] erstellen
Ich möchte zum ersten Mal eine Django-Studie zum Mittagessen [EP1-4] erstellen
Experimentieren Sie, um Tweets für eine lange Zeit zu sammeln (Programmvorbereitung (3))
Experimentieren Sie, um Tweets für eine lange Zeit zu sammeln (Programmvorbereitung (1))
Ich habe ein Paket erstellt, um Zeitreihen mit Python zu filtern
Herausforderung für die zukünftige Umsatzprognose: ② Zeitreihenanalyse mit PyFlux
TensorFlow-Lernmethode für Profis der freien Künste und Python-Anfänger
Experimentieren Sie, um Tweets für eine lange Zeit zu sammeln (Programmvorbereitung (2))
Experimentieren Sie, um Tweets für eine lange Zeit zu sammeln (Programmvorbereitung (5))
Zeitreihenanalyse Teil 4 VAR
Zeitreihenanalyse Teil 3 Prognose
Herausforderung für die zukünftige Umsatzprognose: ⑤ Zeitreihenanalyse von Prophet
~ Tipps für Python-Anfänger mit Liebe von Pythonista ③ ~
Zeitreihenanalyse Teil 1 Autokorrelation
Erstellt eine Methode zum Downsample für nicht ausgeglichene Daten (für die Binomialklassifizierung).
Herausforderung für die zukünftige Umsatzprognose: ① Was ist Zeitreihenanalyse?
Ich möchte vorerst eine Docker-Datei erstellen.
[Version 2020 für Anfänger] Empfohlene Lernmethode für diejenigen, die selbst KI-Ingenieur werden möchten
Experimentieren Sie, um Tweets für eine lange Zeit (unmittelbar vor der Ausführung) zu sammeln.
<Pandas> Umgang mit Zeitreihendaten in der Pivot-Tabelle
Jetzt ist es an der Zeit, DB mit Docker zu installieren! DB-Installation für Anfänger auf Docker
Python: Zeitreihenanalyse: Vorverarbeitung von Zeitreihendaten
Umsatzprognose für die Zeitreihenanalyse
Bewegungsstatistik zur Vorhersage von Zeitreihen
Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Wie man für den Deep Learning Association G-Test (für Anfänger) lernt [Version 2020]
[Für Anfänger] Skript innerhalb von 10 Zeilen (5. Resample von Zeitreihendaten mit Pandas)
Tipps für Python-Anfänger, um das Scikit-Image-Beispiel für sich selbst zu verwenden 3 Schreiben Sie in eine Datei
(Erhaltene Version: von Zeit zu Zeit aktualisiert) Eine Sammlung nützlicher Tutorials für Datenanalyse-Hackathons von Team AI
Zeitreihenanalyse 2 Stabilität, ARMA / ARIMA-Modell
[Python] Protokoll des Studientreffens für Anfänger (7/15)
So vergleichen Sie Zeitreihendaten-Derivative DTW, DTW-
Zeitreihenanalyse 4 Konstruktion des SARIMA-Modells
matplotlib Schreiben Sie Text in ein Zeitreihendiagramm
Anfänger lesen "Einführung in TensorFlow 2.0 für Experten"
Umgang mit Zeitreihendaten (Implementierung)
Zeitreihenanalyse Nr. 6 Gefälschte Rückkehr und republikanischer Teil
Ein Lehrbuch für Anfänger von Python-Anfängern
Experimentieren Sie, um Tweets über einen längeren Zeitraum zu sammeln (Aggregation und Bestätigung des Inhalts).
Was ich dachte und lernte, 100 Tage an einer Programmierschule zu studieren
Einführung in die Zeitreihenanalyse ~ Saisonales Anpassungsmodell ~ In R und Python implementiert
Herausforderung für die zukünftige Umsatzprognose: ④ Zeitreihenanalyse unter Berücksichtigung der Saisonalität nach Statistikmodellen
Ich möchte maschinelles Lernen auch ohne Server durchführen - Time Series Edition -
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.