"Abrufen von Zeitreihendaten von k-db.com mit Python" Memo zur Erstellung der Programmumgebung

Installieren Sie in der Cloud9-Entwicklungsumgebung jupyter und führen Sie das Aktienerfassungsprogramm von k-db.com in dieser Umgebung aus.

Postscript 2018.2.22 Es wurde gesagt, dass k-db Ende 2017 eingestellt wird.

Ich studiere Deep Learning und denke an ein Programm zur Prognose von Aktienkursen anhand von Aktiendaten. Es gibt jedoch fast keine Möglichkeit, die Daten aller TSE-Marken in 5 Minuten abzurufen, selbst wenn Sie unterschiedlich suchen. Und schließlich habe ich k-db.com gefunden. Diese Seite ist 4 Tage lang gültig, es werden jedoch Informationen zu 5 Minuten einzelner Marken veröffentlicht. Das Herunterladen und Bearbeiten dieser Dateien dauert jedoch sehr lange. Und ich habe ein Programm gefunden, das automatisch Aktienkursdaten in 5 Minuten von dieser Seite erfasst. Sie finden es unter der folgenden URL.

Programm, um den Aktienkurs von k-db.com zu erhalten Ich habe dieses Programm für "Abrufen von Zeitreihendaten von k-db.com mit Python" verwendet. http://qiita.com/sawadybomb/items/03c3814268d3e2904e6c cloud9, python Ich bin neu in Python und es funktioniert nicht sehr gut.

Umgebung

cloud9 (kostenpflichtige Version) jupyter python 3.5.3

Verfahren

Erstellen Sie zunächst eine Umgebung für Anakonda und Jupiter.

Siehe hier http://qiita.com/KenjiKitagawa/items/e0225d9be10ea3dbdafc

Laden Sie das Aktienerfassungsprogramm von k-db.com herunter und stellen Sie es bereit

https://github.com/sawadyrr5/pykdb Laden Sie das Programm von hier auf Ihren PC herunter und stellen Sie es unter dem Jupiter von Cloud9 bereit.

Starten Sie eine Datei mit dem Namen setup.py

Führen Sie das Setup der heruntergeladenen Datei aus. Führen Sie die Installation von python setup.py über die Befehlszeile aus

Als ich "tutorial_stocks.ipynb" unter dem Beispielordner von jupyter startete, funktionierte es ordnungsgemäß.

Abhängig von der Marke gab es jedoch einen Teil, in dem die Daten fehlten, und selbst wenn ich mir die Akquisitionsquelle k-db.com ansah, waren die Daten immer noch nicht enthalten. Die Problemumgehung ist unten beschrieben.

Programmausführungsergebnis NAN hat keine Daten stock1.jpg

Beispiel für Gegenmaßnahmen, wenn ein Teil der Daten zu NAN wird

Da die Originaldaten von k-db.com NAN sind, ist es unmöglich, die Daten abzurufen. Ursprünglich benötigen diese Daten einen geeigneten numerischen Wert, um tiefgreifendes Erlernen der künstlichen Intelligenz zu ermöglichen. Da die Anzahl der NANs jedoch gering ist, habe ich beschlossen, den numerischen Wert aus den vorherigen und nächsten numerischen Werten (linearer numerischer Wert) vorherzusagen und einzugeben.

Fügen Sie df = df.interpolate (hoge) unter df = obj.hoge im Beispielprogramm unter dem Beispielverzeichnis ein. Beispiel

df = obj.price(date_from=start, date_to=end, symbol=i_old, freq=stock_freq)   
df = df.interpolate(method='index') #Interpolieren Sie NAN-Daten mit linearen Werten für Vorder- und Rückseite

Nach der Ergänzung stock2.jpg

Recommended Posts

"Abrufen von Zeitreihendaten von k-db.com mit Python" Memo zur Erstellung der Programmumgebung
Holen Sie sich mit Python Zeitreihendaten von k-db.com
[Zeitreihen mit Handlung] Dynamische Visualisierung mit Handlung [Python, Aktienkurs]
Laden Sie japanische Aktienkursdaten mit Python herunter
Holen Sie sich Aktienkursdaten mit Quandl API [Python]
Schreiben Sie den Felderstellungsknoten von SPSS Modeler mit Python neu. Merkmalsextraktion aus Zeitreihensensordaten
Bei der Erfassung von Aktienkursdaten mit Pandas-datareader fehlen Daten
[Python] Zeichnen Sie Zeitreihendaten
Holen Sie sich Lager mit Python
Ein Memo, das mit Python & Spark Daten aus dashDB liest
Python-Programm, das die Zeitnutzung aus icalendar-Daten aggregiert
Python: Zeitreihenanalyse: Vorverarbeitung von Zeitreihendaten
[Aktienkursanalyse] Pandas lernen mit fiktiven Daten (001: Vorbereitung der Umgebung auf das Lesen von Dateien)
Zeichnen Sie die CSV von Zeitreihendaten mit einem Unixtime-Wert in Python (matplotlib).
Vorhersage von Zeitreihendaten durch Simplex-Projektion
Empfangen Sie Textdaten von MySQL mit Python
[Hinweis] Mit Python Daten von PostgreSQL abrufen
Erste Schritte mit Dynamo von Python Boto
Formatieren und Anzeigen von Zeitreihendaten mit verschiedenen Maßstäben und Einheiten mit Python oder Matplotlib
Sammeln von Informationen von Twitter mit Python (Umgebungskonstruktion)
Erfassung von Zeitreihendaten (täglich) von Aktienkursen
[Python] Konvertierungsnotiz zwischen Zeitdaten und numerischen Daten
Ein Memo beim Erstellen einer Python-Umgebung mit Miniconda
Zeigen Sie Details zu Zeitreihendaten mit Remotte an
Flow Memo beim Abrufen von JSON-Daten mit urllib
Automatische Erfassung von Aktienkursdaten mit Docker-Compose
Web Scraping mit Python (Aktienkurs)
Von der Python-Umgebungskonstruktion zur virtuellen Umgebungskonstruktion mit Anaconda
Python & Machine Learning Study Memo ⑦: Aktienkursprognose
Extrahieren Sie mit Python Daten von einer Webseite
Implementierung der Clustering-K-Form-Methode für Zeitreihendaten [Unüberwachtes Lernen mit Python Kapitel 13]
Vorhersage aus verschiedenen Daten in Python mit dem Zeitreihen-Vorhersage-Tool Facebook Prophet
Merkmalsmenge, die aus Zeitreihendaten extrahiert werden kann
Empfangen Sie Wörterbuchdaten von Python-Programmen mit AppleScript
Python 3.4 Windows7-64bit-Umgebung erstellen (für die Analyse finanzieller Zeitreihen)
Geben Sie die Zeit ab dem Start des Programms in Python aus
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
[Grundlagen der Datenwissenschaft] Sammeln von Daten aus RSS mit Python
Abrufen von Daten aus der Datenbank über ODBC mit Python (Access)
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen