[PYTHON] Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten

Aidemy 2020/10/29

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur KI-Fachschule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der dritte Beitrag der Zeitreihenanalyse. Freut mich, dich kennenzulernen.

Was diesmal zu lernen ・ Behandeln Sie Zeitreihendaten mit Pandas ・ So stellen Sie Zeitreihendaten stationär

Behandeln Sie Zeitreihendaten mit Pandas

Laden und Anzeigen von Daten

Zeitinformationen in Index konvertieren

-Sie können den Anfang und das Ende der in (1) eingegebenen Originaldaten und das Intervall mit __df.head () __ und __df.tail () __ überprüfen.

・ Code![Screenshot 2020-10-29 14.00.33.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/8846bc71-71c3-998c- 537b-cd65c3c57872.png)

・ Ergebnis![Screenshot 2020-10-29 14.00.19.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/efb179c4-e69c-3c49- 6315-bde299bfbfc4.png)

Ursachen, wenn Daten nicht stationär sind

-Die Ursachen, wenn Zeitreihendaten nicht konstant sind, sind __ "Trend" __ und "__ saisonale Variation" __. ・ Wenn es eine Beständigkeit gibt, sollte der erwartete Wert konstant sein, aber wenn es einen __positiven Trend gibt, bedeutet dies, dass der erwartete Wert auf einem Aufwärtstrend ist __, so dass nicht gesagt werden kann, dass es eine Beständigkeit gibt. ・ In ähnlicher Weise sollte der Autokorrelationskoeffizient bei Beständigkeit konstant sein, aber der Autokorrelationskoeffizient ist für Daten mit saisonalen Schwankungen konstant, dh Daten, bei denen der Wert plötzlich nur für einen Zeitraum des Jahres zunimmt oder abnimmt. Das kann man nicht sagen.

Machen Sie Zeitreihendaten stationär

Beseitigung von Trends und saisonalen Schwankungen

・ Die folgenden vier Methoden können verwendet werden, um Trends und saisonale Schwankungen zu beseitigen und die Stabilität aufrechtzuerhalten. Details werden später beschrieben. ・ Gleichmäßige Verteilung der Schwankungen mit __log-Konvertierung __ ・ Nehmen Sie __Moving Average __, um den Trend abzuschätzen und zu entfernen ・ In __staff-Serie konvertieren __ (allgemein) ・ __ Saisonale Anpassung durchführen __

Protokollkonvertierung

・ Code![Screenshot 2020-10-29 14.03.41.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/f3df871c-656e-8524- 0451-329add719538.png)

・ Ergebnis![Screenshot 2020-10-29 14.03.26.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/447705c8-b9fd-4df5- 94c1-c04840f6dc45.png)

gleitender Durchschnitt

-__ Bewegungsdurchschnitt __ bedeutet, den Durchschnitt eines bestimmten Abschnitts zu nehmen, während der Abschnitt verschoben wird. -Der gleitende Durchschnitt ermöglicht die Glättung der Daten unter Beibehaltung der Eigenschaften der Originaldaten. Dies ermöglicht es, __ saisonale Schwankungen zu entfernen und Trends __ zu extrahieren.

・ Der gleitende Durchschnitt kann wie folgt berechnet werden. __Data .rolling (Fenster = Anzahl der gleitenden Durchschnitte) .mean () __

-Code (CO2-Konzentrationsdaten, gleitender Durchschnitt alle 51 Wochen (1 Jahr))![Screenshot 2020-10-29 14.08.16.png](https: //qiita-image-store.s3.ap) -northeast-1.amazonaws.com/0/698700/3acdfc2c-6d10-a226-0f5c-740246fdfd67.png)

・ Ergebnis![Screenshot 2020-10-29 14.08.35.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/b1662775-9436-06d6- 173b-78733ceaf6c2.png)

Bodendifferenzserie

・ Code![Screenshot 2020-10-29 14.09.39.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/bc547a8a-ee6f-aaf6- 01e1-53a367ecadf3.png)

・ Ergebnis![Screenshot 2020-10-29 14.09.30.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/9f8ed0bc-d3a3-543f- b80f-8b0a7a17d56f.png)

Saisonale Anpassung

・ Code![Screenshot 2020-10-29 14.19.05.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/d35cd55e-e896-dd35- fe13-c71155db3fd6.png)

・ Ergebnis![Screenshot 2020-10-29 14.19.13.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/dc2f14cd-6f70-f0d2- 4092-60ba30444634.png)

Zusammenfassung

Diese Zeit ist vorbei. Vielen Dank für das Lesen bis zum Ende.

Recommended Posts

Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Python: Zeitreihenanalyse: Vorverarbeitung von Zeitreihendaten
Differenzierung von Zeitreihendaten (diskret)
Zeitreihenanalyse 4 Konstruktion des SARIMA-Modells
Python: Zeitreihenanalyse
RNN_LSTM1 Zeitreihenanalyse
Zeitreihenanalyse 1 Grundlagen
Vorverarbeitung von Präfekturdaten
Erfassung von Zeitreihendaten (täglich) von Aktienkursen
Glättung von Zeitreihen und Wellenformdaten 3 Methoden (Glättung)
Zeigen Sie Details zu Zeitreihendaten mit Remotte an
Leistungsfähigkeit von Vorhersagemethoden in der Zeitreihendatenanalyse Halboptimierung (SARIMA) [Memo]
Zeitreihenanalyse Teil 4 VAR
Zeitreihenanalyse Teil 3 Prognose
[Python] Zeichnen Sie Zeitreihendaten
Zeitreihenanalyse Teil 1 Autokorrelation
Abnormalitätserkennung von Zeitreihendaten durch LSTM (Keras)
Berechnung der Zeitreihen-Kundenbindung
Umsatzprognose für die Zeitreihenanalyse
Über Zeitreihendaten und Übertraining
Eine Geschichte über das Clustering von Zeitreihendaten des Austauschs
Empfehlung zur Datenanalyse mit MessagePack
Datenverarbeitung 2 Analyse verschiedener Datenformate
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen
Was Sie bei der Zeitreihendatenanalyse (einschließlich Reflexion) nicht tun sollten
So extrahieren Sie Funktionen von Zeitreihendaten mit PySpark Basics
Vergleich der Vorhersage von Zeitreihendaten zwischen dem SARIMA-Modell und dem Prophet-Modell
Vorhersage von Zeitreihendaten durch Simplex-Projektion
Zeitreihenanalyse 2 Stabilität, ARMA / ARIMA-Modell
Vorhersage von Zeitreihendaten mit einem neuronalen Netzwerk
Ich habe versucht, Zeitreihen zu analysieren! (AR-Modell)
Zeitreihenanalyse Teil 2 AR / MA / ARMA
[Python] Beschleunigt das Laden von Zeitreihen-CSV
Erkennung von Zeitreihendatenanomalien für Anfänger
Konvertierung von Zeitdaten in 25-Uhr-Notation
Umgang mit Zeitreihendaten (Implementierung)
Vorverarbeitung beim maschinellen Lernen 1 Datenanalyseprozess
OpenFOAM-Zeitreihendaten lesen und Daten einstellen
Zeitreihenanalyse Nr. 6 Gefälschte Rückkehr und republikanischer Teil
[Für Anfänger] Skript innerhalb von 10 Zeilen (5. Resample von Zeitreihendaten mit Pandas)
Zeitmessung
Datenanalyse Titanic 2
Datenanalyse Python
Zeitreihenzerlegung
Datenanalyse Titanic 1
Zeichnen Sie die CSV von Zeitreihendaten mit einem Unixtime-Wert in Python (matplotlib).
Datenanalyse Titanic 3
[Kaggle] Ich habe versucht, mithilfe von tsfresh das Feature-Quantity-Engineering mehrdimensionaler Zeitreihendaten durchzuführen
Python: Zeitreihenanalyse: Erstellen eines SARIMA-Modells
Holen Sie sich mit Python Zeitreihendaten von k-db.com
Zeitvariationsanalyse von Schwarzen Löchern mit Python
Verkürzung der Analysezeit von Openpose mithilfe von Sound
Zusammenfassung der Kaggle-Kernel-Methode [Tabelle Zeitreihendaten]
[Python] Datenanalyse, maschinelles Lernen (Kaggle) -Datenvorverarbeitung-
Lesen von Zeitreihendaten in PyTorch
Emotionale Analyse umfangreicher Tweet-Daten durch NLTK
Datenbereinigung 3 Verwendung von OpenCV und Vorverarbeitung von Bilddaten
Aufgezeichnete Umgebung für die Datenanalyse mit Python
Datenanalyse mit xarray