[PYTHON] Aktienkursprognose 2 Kapitel 2

Aidemy 2020/10/30

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur KI-Fachschule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der zweite Beitrag der Aktienkursprognose. Freut mich, dich kennenzulernen.

Was diesmal zu lernen ・ ③ Erfassen Sie Zeitreihendaten des durchschnittlichen Aktienkurses von Nikkei ・ ④ Erstellen Sie ein Modell, das die Höhen und Tiefen der Aktienkurse vorhersagt

③ Erfassen Sie Zeitreihendaten des durchschnittlichen Aktienkurses von Nikkei

Ablauf der Zeitreihendatenerfassung

I. Zeitreihendaten von Aktienkursen erfassen und in DataFrame konvertieren Ii Andere Elemente als den "Schlusskurs" der Daten löschen und nach Datum sortieren Ⅲ Kombinieren Sie Tweet-Daten und Zeitreihendaten

I. Zeitreihendaten von Aktienkursen erfassen und in DataFrame konvertieren

·Code スクリーンショット 2020-10-20 17.14.41.png

Ii Andere Elemente als den "Schlusskurs" der Daten löschen und nach Datum sortieren

-In dieser Vorhersage werden nur __ "Datumsdatum" __ und __ "Schlusskurs" __ verwendet, also __ die anderen __ löschen. Außerdem möchte ich die Daten nach __date __ sortieren, also konvertiere ich das "Datendatum" in __index und sortiere es . - "pd.to_datetime ()" __ behandelt "Datendatum" als Zeitreihendaten. Verwenden Sie außerdem __ "set_index ()" __, um dies zu einem Index zu machen. -Die Daten, die dieses Mal nicht verwendet wurden __ ['offener Preis', 'hoher Preis', 'niedriger Preis'] __ werden mit __ "drop ()" __ und __ "sort_index (ascending = True)" __ gelöscht Sortieren Sie die Daten in aufsteigender Reihenfolge (älteste zuerst) mit.

·Code スクリーンショット 2020-10-20 18.24.52.png

Ⅲ Kombinieren Sie Tweet-Daten und Zeitreihendaten

-Die im vorherigen Abschnitt erstellten und im vorherigen Abschnitt organisierten Zeitreihendaten __ "df" __ und die in Kapitel 1 erstellten und mit dem PN-Wert verknüpften Tweet-Daten __ "df_tweets" __ "join ()". Kombiniere mit __ und lösche NaN mit __ "dropna ()" __. Speichern Sie es als "table.csv" mit __ "to_csv ()" __.

・ Code![Screenshot 2020-10-20 18.40.26.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/e66eda5b-959c-bb46- 2e0b-fa7d9051bc85.png)

・ Ausgabeergebnis (nur Teil) スクリーンショット 2020-10-20 20.46.09.png

④ Erstellen Sie ein Modell, das die Höhen und Tiefen des Aktienkurses am nächsten Tag anhand der täglichen Stimmung vorhersagt.

Fluss der Aktienkursprognose

Ich teile die Daten und erstelle Daten mit dem Index "Datum" und der Spalte "PN-Wert" und "Schlusskurs". Ii Erstellen Sie Daten mit dem Index "Datum" und der Spalte "PN-Wert" und "Schlusskurs". Ⅲ Berechnen Sie die Differenz zwischen dem Aktienkurs (Endwert) und dem Vortag des PN-Werts für Trainingsdaten Ⅳ Ermitteln Sie die Differenz zwischen dem Aktienkurs (Endwert) und dem PN-Wert für die letzten drei Tage am Tag i und berechnen Sie sie als Merkmalsmenge. Ⅴ Erstellen Sie ein Modell aus Funktionen

I. Daten teilen und standardisieren

・ Dieses Mal werden wir den Aktienkurs mit __ "Technische Analyse" __ prognostizieren. Bei dieser Methode werden die Änderung (Differenz) des durchschnittlichen Aktienkurses in den letzten 3 Tagen und die Änderung (Differenz) des PN-Werts __ als Merkmalsgrößen verwendet, um die Höhen und Tiefen des Aktienkurses am nächsten Tag vorherzusagen.

·Code スクリーンショット 2020-10-20 21.00.31.png

Ii Erstellen Sie Daten mit dem Index "Datum" und der Spalte "PN-Wert" und "Schlusskurs".

・ Nach der Standardisierung besteht der nächste Schritt darin, Trainingsdaten und Testdaten in DataFrame zu konvertieren. Die Spalte ist __ "PN-Wert" und "Schlusskurs" __ und speichert __ "standardisiertes X" bzw. "y" __. Außerdem ist __index ein Datum __.

·Code スクリーンショット 2020-10-20 21.18.57.png

Ⅲ Berechnen Sie die Differenz zwischen dem Aktienkurs (Endwert) und dem Vortag des PN-Werts für Trainingsdaten

-__ Der Zweck besteht darin, die Änderung (Differenz) zwischen dem PN-Wert und dem Schlusskurs für die letzten 3 Tage zu berechnen. Verarbeiten Sie also zuerst die Daten, damit die Änderung pro Tag berechnet werden kann. ・ Öffnen Sie zunächst die im vorherigen Abschnitt erstellte Datei df_train.csv. Da dieser DataFrame unmittelbar danach aufgeteilt wird, erstellen Sie eine leere Liste, damit sie für jedes Element gespeichert werden kann. Insbesondere "exchange_dates" zum Speichern von Daten, "pn_rates" zum Speichern von PN-Werten, "pn_rates_diff" zum Ermitteln der Differenz zum PN-Wert in der vorherigen Zeile und "pn_rates_diff" zum Speichern von Aktienkursen (Schlusskursen) auf dieselbe Weise. Bereiten Sie eine leere Liste mit "exchange_rates" und "exchange_rates_diff" vor, die die Differenz zum Aktienkurs der vorherigen Zeile ermittelt.

・ Sobald Sie diesen Punkt erreicht haben, wird __DataFrame aufgeteilt __. Ich möchte einen Tag nach dem anderen damit umgehen, also nehme ich __ Zeile für Zeile __ heraus. Teilen Sie es für jede Zeile durch __ ",", die erste Spalte ist das Datum, die zweite Spalte ist der PN-Wert und die dritte Spalte ist der Aktienkurs, also jedes __ in der zuvor erstellten leeren Liste Geschäft __.

·Code スクリーンショット 2020-10-20 22.52.10.png

Ⅳ Ermitteln Sie die Differenz zwischen dem Aktienkurs (Endwert) und dem PN-Wert für die letzten drei Tage am Tag i und berechnen Sie sie als Merkmalsmenge.

・ Wenn Sie die Änderungen pro Tag beschreiben können, schreiben Sie die Änderungen alle __3 Tage auf die gleiche Weise __.

-Die bisherige Erklärung und der folgende Code beziehen sich ausschließlich auf Trainingsdaten, aber natürlich sind auch Testdaten erforderlich, um ein Modell zu erstellen. Daher ist es erforderlich, dasselbe für __testdaten __ zu tun.

·Code スクリーンショット 2020-10-20 22.52.51.png

Ⅴ Erstellen Sie ein Modell aus Funktionen

・ Nachdem Sie Trainingsdaten und Lehreretiketten für Trainingsdaten und Testdaten erstellt haben, können Sie daraus endlich ein Modell erstellen.

Zusammenfassung

Diese Zeit ist vorbei. Vielen Dank für das Lesen bis zum Ende.

Recommended Posts

Aktienkursprognose 2 Kapitel 2
Aktienkursprognose 1 Kapitel 1
Aktienkursprognose mit Tensorflow
Python: Aktienkursprognose Teil 2
Python: Aktienkursprognose Teil 1
[Python] Meine Aktienkursprognose [HFT]
Aktienkursprognose mit maschinellem Lernen (Scikit-Learn)
Aktienkursprognose mit Deep Learning (TensorFlow)
Aktienprognose mit TensorFlow (LSTM) ~ Aktienprognose Teil 1 ~
Aktienkursprognose mit maschinellem Lernen (Return Edition)
Aktienkursprognose mit Deep Learning (TensorFlow) -Teil 2-
Preisschwankungsprognose für virtuelle Währungen
Aktienkursprognose durch maschinelles Lernen Numerai Signals
Kaggle ~ Home Preisprognose ② ~
Python & Machine Learning Study Memo ⑦: Aktienkursprognose
Aktienkursprognose mit Deep Learning [Datenerfassung]
Kaggle ~ Home Preisprognose ~
Aktienkursprognose mit TensorFlow (mehrschichtiges Perceptron: MLP) ~ Aktienprognose 2 ~
Aktienkursprognose mit LSTM_1
Holen Sie sich Lager mit Python
Tipps zur Erfassung von Aktienkursdaten
[Einführung in Systre] Aktienkursprognose; schwach am Montag m (__) m
Aktienkursprognose durch maschinelles Lernen Beginnen wir mit Numerai
Bitcoin-Preisprognose mit TensorFlow (LSTM)
Aktienkurs Prognose durch maschinelles Lernen ist so wahr, Numerai Signale
Ich habe einen UNIQLO-Aktienprognosedatensatz an Kaggle gesendet
Aktienerfassungscode durch Schaben (Selen)
Laden Sie japanische Aktienkursdaten mit Python herunter
[Python] Erstellen eines Aktien-Drawdown-Diagramms
Aktienkurs und Statistik (Mittelwert, Standardabweichung)
4. Monat, um die Aktienprognose AI für 10 Stunden am Tag fortzusetzen
Machen Sie weiterhin eine Aktienprognose AI für 10 Stunden pro Tag im 3. Monat