Postscript 2018.2.22 Es wurde gesagt, dass k-db Ende 2017 eingestellt wird.
Ich studiere Deep Learning und denke an ein Programm zur Prognose von Aktienkursen anhand von Aktiendaten. Es gibt jedoch fast keine Möglichkeit, die Daten aller TSE-Marken in 5 Minuten abzurufen, selbst wenn Sie unterschiedlich suchen. Und schließlich habe ich k-db.com gefunden. Diese Seite ist 4 Tage lang gültig, es werden jedoch Informationen zu 5 Minuten einzelner Marken veröffentlicht. Das Herunterladen und Bearbeiten dieser Dateien dauert jedoch sehr lange. Und ich habe ein Programm gefunden, das automatisch Aktienkursdaten in 5 Minuten von dieser Seite erfasst. Sie finden es unter der folgenden URL.
Programm, um den Aktienkurs von k-db.com zu erhalten Ich habe dieses Programm für "Abrufen von Zeitreihendaten von k-db.com mit Python" verwendet. http://qiita.com/sawadybomb/items/03c3814268d3e2904e6c cloud9, python Ich bin neu in Python und es funktioniert nicht sehr gut.
cloud9 (kostenpflichtige Version) jupyter python 3.5.3
Siehe hier http://qiita.com/KenjiKitagawa/items/e0225d9be10ea3dbdafc
https://github.com/sawadyrr5/pykdb Laden Sie das Programm von hier auf Ihren PC herunter und stellen Sie es unter dem Jupiter von Cloud9 bereit.
Führen Sie das Setup der heruntergeladenen Datei aus. Führen Sie die Installation von python setup.py über die Befehlszeile aus
Abhängig von der Marke gab es jedoch einen Teil, in dem die Daten fehlten, und selbst wenn ich mir die Akquisitionsquelle k-db.com ansah, waren die Daten immer noch nicht enthalten. Die Problemumgehung ist unten beschrieben.
Programmausführungsergebnis NAN hat keine Daten
Da die Originaldaten von k-db.com NAN sind, ist es unmöglich, die Daten abzurufen. Ursprünglich benötigen diese Daten einen geeigneten numerischen Wert, um tiefgreifendes Erlernen der künstlichen Intelligenz zu ermöglichen. Da die Anzahl der NANs jedoch gering ist, habe ich beschlossen, den numerischen Wert aus den vorherigen und nächsten numerischen Werten (linearer numerischer Wert) vorherzusagen und einzugeben.
Fügen Sie df = df.interpolate (hoge) unter df = obj.hoge im Beispielprogramm unter dem Beispielverzeichnis ein. Beispiel
df = obj.price(date_from=start, date_to=end, symbol=i_old, freq=stock_freq)
df = df.interpolate(method='index') #Interpolieren Sie NAN-Daten mit linearen Werten für Vorder- und Rückseite
Nach der Ergänzung
Recommended Posts