Postscript 2018.2.22 Il a été dit que k-db sera interrompu à la fin de 2017.
J'étudie le deep learning et je pense à un programme de prévision des cours boursiers à partir des données boursières. Cependant, il n'y a presque aucun moyen d'obtenir les données de toutes les marques TSE en 5 minutes, même si vous effectuez des recherches diverses. Et finalement j'ai trouvé k-db.com. Ce site dure 4 jours, mais des informations sur 5 minutes de marques individuelles sont publiées. Cependant, il faut beaucoup de temps pour télécharger et éditer celui-ci un par un. Et j'ai trouvé un programme qui acquiert automatiquement les données de cours boursier en 5 minutes depuis ce site. Vous pouvez le trouver à l'URL ci-dessous.
Programme pour obtenir le cours de l'action sur k-db.com J'ai utilisé ce programme pour "Obtenir des données de séries chronologiques de k-db.com avec Python". http://qiita.com/sawadybomb/items/03c3814268d3e2904e6c cloud9, python Je suis nouveau en python et cela ne fonctionne pas très bien.
cloud9 (version payante) jupyter python 3.5.3
Vois ici http://qiita.com/KenjiKitagawa/items/e0225d9be10ea3dbdafc
https://github.com/sawadyrr5/pykdb Téléchargez le programme à partir d'ici sur votre PC et déployez-le sous le jupyter de cloud9.
Exécutez la configuration du fichier téléchargé. Exécutez l'installation de python setup.py à partir de la ligne de commande
Cependant, selon la marque, il y avait une partie où les données manquaient, et même lorsque j'ai regardé la source d'acquisition k-db.com, les données n'étaient toujours pas incluses. La solution de contournement est écrite ci-dessous.
Le résultat de l'exécution du programme NAN n'a pas de données
Étant donné que les données originales de k-db.com sont NAN, il est impossible d'obtenir les données. À l'origine, ces données nécessitent une valeur numérique appropriée à utiliser pour l'apprentissage en profondeur de l'intelligence artificielle, mais comme le nombre de NAN est petit, j'ai décidé de prédire la valeur numérique à partir des valeurs numériques précédentes et suivantes (valeur numérique linéaire) et de la saisir.
Placez df = df.interpolate (hoge) sous df = obj.hoge dans le programme exemple sous le répertoire exemple. Exemple
df = obj.price(date_from=start, date_to=end, symbol=i_old, freq=stock_freq)
df = df.interpolate(method='index') #Interpoler les données NAN avec des valeurs linéaires avant et arrière
Après complémentation
Recommended Posts