"Obtenir des données de séries chronologiques de stock à partir de k-db.com avec Python" Mémo de création d'environnement de programme

Dans l'environnement de développement Cloud9, installez jupyter et exécutez le programme d'acquisition d'actions à partir de k-db.com dans cet environnement.

Postscript 2018.2.22 Il a été dit que k-db sera interrompu à la fin de 2017.

J'étudie le deep learning et je pense à un programme de prévision des cours boursiers à partir des données boursières. Cependant, il n'y a presque aucun moyen d'obtenir les données de toutes les marques TSE en 5 minutes, même si vous effectuez des recherches diverses. Et finalement j'ai trouvé k-db.com. Ce site dure 4 jours, mais des informations sur 5 minutes de marques individuelles sont publiées. Cependant, il faut beaucoup de temps pour télécharger et éditer celui-ci un par un. Et j'ai trouvé un programme qui acquiert automatiquement les données de cours boursier en 5 minutes depuis ce site. Vous pouvez le trouver à l'URL ci-dessous.

Programme pour obtenir le cours de l'action sur k-db.com J'ai utilisé ce programme pour "Obtenir des données de séries chronologiques de k-db.com avec Python". http://qiita.com/sawadybomb/items/03c3814268d3e2904e6c cloud9, python Je suis nouveau en python et cela ne fonctionne pas très bien.

environnement

cloud9 (version payante) jupyter python 3.5.3

procédure

Tout d'abord, créez un environnement pour anaconda et jupyter.

Vois ici http://qiita.com/KenjiKitagawa/items/e0225d9be10ea3dbdafc

Téléchargez et déployez le programme d'acquisition de stock sur k-db.com

https://github.com/sawadyrr5/pykdb Téléchargez le programme à partir d'ici sur votre PC et déployez-le sous le jupyter de cloud9.

Lancez un fichier appelé setup.py

Exécutez la configuration du fichier téléchargé. Exécutez l'installation de python setup.py à partir de la ligne de commande

Quand j'ai démarré "tutorial_stocks.ipynb" sous le dossier d'exemple de jupyter, cela fonctionnait correctement.

Cependant, selon la marque, il y avait une partie où les données manquaient, et même lorsque j'ai regardé la source d'acquisition k-db.com, les données n'étaient toujours pas incluses. La solution de contournement est écrite ci-dessous.

Le résultat de l'exécution du programme NAN n'a pas de données stock1.jpg

Exemple de contre-mesures lorsqu'une partie des données devient NAN

Étant donné que les données originales de k-db.com sont NAN, il est impossible d'obtenir les données. À l'origine, ces données nécessitent une valeur numérique appropriée à utiliser pour l'apprentissage en profondeur de l'intelligence artificielle, mais comme le nombre de NAN est petit, j'ai décidé de prédire la valeur numérique à partir des valeurs numériques précédentes et suivantes (valeur numérique linéaire) et de la saisir.

Placez df = df.interpolate (hoge) sous df = obj.hoge dans le programme exemple sous le répertoire exemple. Exemple

df = obj.price(date_from=start, date_to=end, symbol=i_old, freq=stock_freq)   
df = df.interpolate(method='index') #Interpoler les données NAN avec des valeurs linéaires avant et arrière

Après complémentation stock2.jpg

Recommended Posts

"Obtenir des données de séries chronologiques de stock à partir de k-db.com avec Python" Mémo de création d'environnement de programme
Obtenez des données de séries chronologiques de k-db.com avec Python
[Série chronologique avec plotly] Visualisation dynamique avec plotly [python, cours boursier]
Téléchargez les données de cours des actions japonaises avec Python
Obtenez des données sur le cours de l'action avec l'API Quandl [Python]
Réécrivez le nœud de création de champ de SPSS Modeler avec Python. Extraction de caractéristiques à partir de données de capteurs de séries temporelles
Il y a un manque de données lors de l'acquisition de données sur le cours des actions avec Pandas-datareader
[Python] Tracer des données de séries chronologiques
Obtenez des stocks avec Python
Un mémo qui lit les données de dashDB avec Python et Spark
Programme Python qui agrège l'utilisation du temps à partir des données icalendar
Python: analyse des séries chronologiques: prétraitement des données des séries chronologiques
[Analyse du cours de l'action] pandas apprenant avec des données fictives (001: préparation de l'environnement à la lecture de fichiers)
Tracer CSV de données de séries temporelles avec une valeur unixtime en Python (matplotlib)
Prédiction des données de séries chronologiques par projection simplex
Recevoir des données textuelles de mysql avec python
[Note] Obtenir des données de PostgreSQL avec Python
Premiers pas avec Dynamo de Python boto
Formater et afficher des données de séries chronologiques avec différentes échelles et unités avec Python ou Matplotlib
Collecter des informations depuis Twitter avec Python (construction de l'environnement)
Acquisition de données chronologiques (quotidiennes) des cours des actions
[Python] Mémo de conversion entre les données temporelles et les données numériques
Un mémo lors de la création d'un environnement python avec miniconda
Voir les détails des données de séries chronologiques dans Remotte
Mémo de flux lors de la récupération de données json avec urllib
Acquisition automatique des données de cours des actions avec docker-compose
Web scraping avec Python (cours de l'action)
De la construction d'environnement Python à la construction d'environnement virtuel avec anaconda
Mémo d'étude Python & Machine Learning ⑦: Prévision du cours de l'action
Extraire des données d'une page Web avec Python
Implémentation de la méthode de clustering k-shape pour les données de séries chronologiques [Apprentissage non supervisé avec python Chapitre 13]
Prédire à partir de diverses données en Python à l'aide de l'outil de prédiction de séries chronologiques Facebook Prophet
Quantité d'entités pouvant être extraite des données de séries chronologiques
Recevez des données de dictionnaire à partir de programmes Python avec AppleScript
Python 3.4 Créer un environnement Windows7-64bit (pour l'analyse des séries chronologiques financières)
Affiche l'heure à partir du moment où le programme a été lancé en python
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
[Bases de la science des données] Collecte de données depuis RSS avec python
Obtenir des données de la base de données via ODBC avec Python (Access)
"Analyse des séries chronologiques de mesure des données économiques et financières" Résolution du problème de fin de chapitre avec Python