[PYTHON] Ich habe 10 Bücher gelesen, die sich auf Zeitreihendaten beziehen, daher werde ich eine Rezension schreiben.

Über die Standposition jedes Buches

Ich mache mir Sorgen darüber, welche Achse die stehende Position erklären soll, aber diesmal habe ich versucht, sie als "Willkür und Vorurteil" mit zwei Achsen über "Zielleserebene" und "Beziehung zu Zeitreihen" zu positionieren.

image.png

Einführung

Bei der Arbeit verwende ich verschiedene Methoden für verschiedene Daten im Zusammenhang mit der Datenanalyse, aber wenn ich sie analysiere, gibt es überraschend viele Zeitreihendaten.

Numerische Vorhersagen und die Erkennung von Anomalien werden häufig zusammen mit der Zeit aufgezeichnet. Um Kenntnisse über diese Zeitreihendaten zu erlangen, habe ich mich entschlossen, das Buch umfassend zu lesen und Kenntnisse zu erwerben. Dieses Mal möchte ich Ihnen beim Kauf Ihres Buches helfen, indem ich eine Rezension zu "Was steht in welchem Buch geschrieben und in welcher Beziehung stehen sie zu anderen Büchern?"

"Überprüfen Sie die Standposition dieses Buches" "Wenn es ein Zeitreihenbuch ist, ist dieses Buch in Akan" Bitte lassen Sie mich wissen, wenn Sie welche haben.

Dieser Artikel hat ein ähnliches Konzept wie Buchhandbuch für Zeitreihenanalyse.

"Was ist besser, Python oder R?" Für Zeitreihendaten

Wenn Sie Zeitreihen lernen möchten, empfehlen wir Ihnen, die Sprache R zu wählen.

Buchtitel und Übersicht

11 Bücher - Stand April 2020

Ich werde nach Amazon fliegen, aber Sie können sich gerne darauf beziehen, da darin keine Werbeeinnahmen für mich enthalten sind.

Index Titel Erläuterung Code Autor / Veröffentlichung
1. Buch VAR empirische Analyse in R gelernt ZeitreihenmodellundinsbesondereVektor-Selbstrückgabe(VAR)Ein Buch zum Verstehen mit der VAR-Funktion von R usw. R Hiroshi Murao:Ohm
2. Buch Finanzieren Sie maschinelles Lernen Ein gutes Buch, das Analysemethoden und -ideen im Zusammenhang mit Finanzen erklärt, während Funktionen in Python implementiert werden python Marcos Lopez de Prado:Studiengruppe Finanzielle und finanzielle Situation
3. Buch Quantitative Ökonomie Ein Buch, das "Zeitreihenmodellierung" mit dem "Know-how-Wörterbuch für die Datenanalyse" kombiniert, das sorgfältig mit Zahlen und mathematischen Formeln erklärt wird, so dass es nicht nur für die Analyse und Modellierung von Zeitreihen, sondern auch für junge Datenwissenschaftler geeignet ist. Keiner Yoshihiko Nishiyama:Yukaku
4. Buch Grundlagen der Zeitreihenanalyse und des Zustandsraummodells LernenSiedasZustandsraummodellmitRundStan.BeginnenSiemitdemeinfachstenModell,SchrittfürSchrittVAR,EinBuch,mitdemSiesogarZustandsraummodellelernenkönnen.LeichtverständlicheStatistikenundZeitreihenBlog"LogicsofBlue"mitCodeAutorenbuch R Shinya Baba:Plejadenverlag
5. Buch Zeitreihenanalyse von Wirtschafts- und Finanzdaten Ein Buch mit einer starken Theorie. Ich habe dieses Buch als erstes Buch gewählt, war aber enttäuscht. Einführende Modellierung von Zeitreihen Nach dem Erlernen des Buches ist es gut, es als Ergänzung zur Theorie zu verwenden. Keiner Ryuyoshi Okimoto:Asakura Buchhandlung
6. Buch Zeitreihendatenanalyse, die sofort vor Ort eingesetzt werden kann Ein Buch, in dem Sie einfache und grundlegende Zeitreihenmodellierungstechniken mit R lernen können. Aufgrund seiner Einfachheit ist es nicht zu leugnen, dass es von anderen Zeitreihenbüchern abgedeckt werden kann. R Daisuke Yokouchi:Technical Review Company
7. Buch Zeitreihenanalyse des Punktprozesses Ein Buch über Wahrscheinlichkeitsverteilung und einige Modelle für die Zeitreihenanalyse. Es kann gut sein, es als Wörterbuch zu bezeichnen. Die Priorität ist niedrig. Keiner Takahiro Omi:Kyoritsu Publishing
8. Buch Metrische Wirtschaftsanalyse von R. Ein Buch, das GARCH und VAR in sich selbst zurückkehrende Modelle einführt, beginnend mit dem Betrieb von R. Da die Anzahl der Blätter gering ist, wird dies für diejenigen empfohlen, die sich vorerst mit der Modellierung von Zeitreihen befassen möchten. R Junichiro Fukuchi:Asakura Buchhandlung
9. Buch Metrische Ökonomie zur empirischen Analyse Andere Bücher enthalten den Inhalt der prädiktiven Modellierung, aber in erster Linie ist es wichtig zu überprüfen, ob die Datenwissenschaft "effektiv ist? Enthält sie eine Verzerrung? Ist der Koeffizient sinnvoll?" Ein Buch, das mich erinnerte. "Empirische Analyse", bei der Sie lernen, während Sie reale Probleme verwenden. Dieses Buch ist keine Zeitreihenmodellierung, wird jedoch Anfängern in der Datenanalyse empfohlen. Keiner Isao Yamamoto:Chuo Keizaisha
10. Buch Zeitreihenanalyse aus den Grundlagen Wie Sie an der Tatsache sehen können, dass der Untertitel einen Filter und eine MCMC enthält, handelt es sich um ein Buch, das sich auf Zustandsraummodelle spezialisiert hat. Die Modellierung von Self-Return-Systemen ist nur eine Einführung. Ein Buch, das mit vielen Zahlen und Codes erklärt. Es kann besser sein, zuerst die Hände zu bewegen, als Formeln und Theorien zusammenzudrücken. R Junichiro Hagiwara:Technical Review Company

Informationen zu Methoden und Typen zur Vorhersage von Zeitreihen

Die Methoden zur Vorhersage von Zeitreihendaten, einschließlich der Zeitreihenmodellierung, können grob in vier Methoden unterteilt werden (** willkürlich **).

  1. Selbstrückgabesystem
  2. Zustandsraumsystem
  3. Rückkehr des maschinellen Lernens
  4. Tiefes Lernen

1. Selbstrückgabesystem

AR, ARMA, ARIMA, SARIMA, ARIMAX, SARIMAX, ARCH, GARCH, VAR

Es handelt sich um eine Gruppe von Zeitreihenmodellierungsmethoden, die es schon lange gibt, und sie ist nicht veraltet genug, um auch heute noch verwendet zu werden.

Zeitreihendaten werden als Funktion ausgedrückt, indem sie in mehrere Komponenten wie "Trend (Trend)", "Autokorrelation (Zyklus)", "Jahreszeit (periodischer Zyklus)" und "Fehler" zerlegt werden. Methode.

image.png

↑ Es wird so zerlegt (die Figur ist das Ergebnis des Propheten).

Um die Daten in diese Komponenten zu zerlegen, sind technische Maßnahmen wie ** Selbstrückgabe, Einheitswurzeltest, Differenz d-Ordnung, Modellauswahl durch AIC ** usw. erforderlich.

Es mag schwierig erscheinen, aber in der heutigen Zeit sind die Hürden gering, da die Modellierung von Selbstrückgabesystemen grundsätzlich automatisiert ist. Theoretisches Wissen ist jedoch auch erforderlich, um Modellierungsergebnisse zu "verstehen und zu berücksichtigen".

Wenn Sie nicht wissen, "welche Art von Theorie für die Berechnung verwendet wird" ・ Ist das Modell aufgrund der automatischen Bestimmung falsch? ・ Können Daten überhaupt durch Selbstrückgabe modelliert werden? Sie werden wichtige Teile wie übersehen.

(Das Lesen mehrerer Bücher erinnerte mich daran, wie wichtig es ist, die Theorie des maschinellen Lernens zu verstehen.)

2. Zustandsraumsystem

Wir werden Zeitreihendaten basierend auf der Idee modellieren, dass sie durch "probabilistisches Hinzufügen eines Werts" zu einem numerischen Wert namens "Zustand" erhalten werden können. Betrachten Sie zwei Formeln, die "Beobachtungsgleichung" und die "Zustandsgleichung". Bei dem Versuch, die Temperatur in Japan zu modellieren, können wir zunächst die periodische Wellenform heißer Sommer und kalter Winter berücksichtigen.

Eines Sommers gab es jedoch viel Regen und die Durchschnittstemperatur sank.

Wenn die periodische Wellenform als japanisches Temperaturmodell behandelt wird, können solche Änderungen jedoch nicht vorhergesagt werden Wenn die Wellenform aus der Aufzeichnung "ob es geregnet hat" korrigiert wird, kann der Temperaturabfall reflektiert werden. Es ist eine Methode zum Erstellen eines Modells basierend auf der Idee.

"Hat es geregnet?" Hier wird eine Gleichung erstellt, die "Zustand" ausdrückt. Da davon ausgegangen wird, dass der "Status" die Daten beeinflusst, besteht der Vorteil, dass es einfacher wird, die Änderung zu erklären, indem der Wert des Status überprüft wird, wenn berücksichtigt wird, "warum der Wert erreicht wurde".

Das Wort "Filter", das im Zustandsraummodell erscheint, bezieht sich auf den Algorithmus, der zum Erstellen und Korrigieren von "Zuständen" verwendet wird. Beim Erstellen eines Zustandsraummodells wird die Wahrscheinlichkeitsdichtefunktion, die der hinteren Wahrscheinlichkeit entspricht, kompliziert, und es ist erforderlich, eine Zufallszahl durch MCMC zu generieren, um den Parameter abzuschätzen.

3. Rückkehr des maschinellen Lernens

Es gibt ein Regressionsmodell als Methode des maschinellen Lernens. Dies ist eine Methode zur Vorhersage numerischer Werte unter Verwendung peripherer erklärender Variablen und vergangener Zeitpunkte anstelle der Zeitreihenmodellierung. In früheren Zeiten waren Methoden wie SVM (SVR) und kürzlich GBDT und LightGNM in Datenanalyse-Wettbewerben usw. aktiv und haben eine breite Palette von Anwendungen wie "Lösen von Klassifizierungsproblemen, schnelle Berechnung und Umgang mit Multivariaten". Ich habe das Gefühl, dass es beiläufig verwendet wird.

Wenn Sie sich mit Zeitreihenmodellierung auskennen, die Theorie kennen und einfach zu formulieren sind, wählen Sie Zeitreihenmodellierung aus. Wenn Sie es multivariat oder schwierig zu formulieren finden, versuchen Sie, mit einem anderen Modell für maschinelles Lernen zurückzukehren.

Ist es nicht ein guter Ansatz?

Lesen Sie das Zeitreihenbuch, damit Sie entscheiden können, ob Sie sich für die Zeitreihenmodellierung entscheiden. Wenn Sie mehr über maschinelles Lernen (Klassifizierung / Regression) erfahren möchten, stelle ich die folgenden Bücher vor.

Index Titel Erläuterung Code Autor / Veröffentlichung
11. Buch Datenanalysetechnologie, die mit Kaggle gewinnt Ein zusammenhängendes Buch über die Verwendung der im Kaggle-Wettbewerb verwendeten Techniken python Daisuke Kadowaki:Technical Review Company

4. Tiefes Lernen

Bei der Verwendung von Deep Learning für Seriendaten werden häufig RNN und verbessertes LSTM verwendet. Manchmal kann es im Fall von Multivariaten als Regression mit mehrschichtigem NN aus der in "3. Regression des maschinellen Lernens" eingeführten Idee gelöst werden. Dies ist ein häufiges Problem beim Deep Learning, kann jedoch ein Problem sein, wenn Sie aufgefordert werden, vorhergesagte Werte zu erklären.

Ich habe noch keine Kenntnisse über Bücher, die ich vorstellen kann, daher werde ich sie weglassen. (Ist ein Buch wie Mr. Negago gut? Wir warten auf die Empfehlung des Buches)

Wenn Sie 11 Bücher lesen und sich am Anfang selbst Ratschläge geben

Wenn Sie es einem Anfänger empfehlen möchten, der in Zukunft mit der Modellierung / Analyse von Zeitreihen beginnen wird, gehen Sie wie folgt vor. Ich habe hier nicht über "Vorhersage (Rückkehr) mit einem maschinellen Lernmodell" nachgedacht, sondern nur über einen Weg, "Zeitreihenmodellierung" zu verstehen.

Ich denke, dass Sie genug Kraft haben, um mit der bisherigen Zeitreihenmodellierungsmethode zu kämpfen.

Für weiteren Fortschritt und Wachstum

Wenn Sie von einem Anfänger zu einer Richtlinie lesen, möchten Sie wachsen

das ist alles

Bisher habe ich die Zeitreihenbücher gelesen und über ihre Eindrücke, Buchbesprechungen und Empfehlungen nachgedacht.

・ "Zeitreihendatenanalyse, die sofort vor Ort verwendet werden kann" dient den Grundlagen, und ich bin der Meinung, dass die Priorität niedrig ist, da es nur wenige Einführungen von Zeitreihenmodellierungsmethoden gibt, wahrscheinlich weil sie alt sind. ・ Obwohl "Measurement Economic Analysis by R" ein altes Buch ist, gibt es viele Methoden zur Modellierung von Zeitreihen, und es werden auch grundlegende R-Operationsmethoden beschrieben. Daher dachte ich, dass sie in vielen Fällen absorbiert werden könnten, und erhöhte daher die Priorität ein wenig.

Ich hoffe es hilft dir beim Lernen.

Recommended Posts

Ich habe 10 Bücher gelesen, die sich auf Zeitreihendaten beziehen, daher werde ich eine Rezension schreiben.
Ich habe 13 Bücher gelesen, die Data Science mit Geschäftsergebnissen verbinden, daher werde ich eine Rezension schreiben.
Lesen von Zeitreihendaten in PyTorch
Ich habe ein Umfragepapier zur Erkennung von Zeitreihenanomalien gelesen und werde es daher zusammenfassen.
Ich habe ein Paket erstellt, um Zeitreihen mit Python zu filtern
<Pandas> Umgang mit Zeitreihendaten in der Pivot-Tabelle
Einführung in datenwissenschaftliche Bücher.
matplotlib Schreiben Sie Text in ein Zeitreihendiagramm
Umgang mit Zeitreihendaten (Implementierung)
Bücher über Datenwissenschaft, die 2020 gelesen werden sollen
Ich habe keine Zeit, kann ich also einfach eine Frage stellen? feat. COTOHA API
Ich möchte maschinelles Lernen auch ohne Server durchführen - Time Series Edition -
Ich musste im Unterricht keinen Dekorateur schreiben. Danke Kontextmanager
Warum muss Python einen Doppelpunkt schreiben?
Ich las "Wie man ein Hacking Lab macht"
Ich möchte mit Python in eine Datei schreiben
Jedes Mal, wenn ich versuche, eine CSV-Datei mit Pandas zu lesen, wird ein numpy-Fehler angezeigt.