J'ai trouvé un service appelé Quandl que j'ai trouvé en recherchant comment obtenir les cours des actions, alors j'ai essayé de l'utiliser.
Quandl
Quandl est un moteur de recherche de données numériques telles que la finance et l'économie, qui peut rechercher des données à partir de diverses sources et afficher des graphiques et des tableaux. Les données peuvent également être téléchargées au format JSON, CSV et dans d'autres formats, ou importées dans des services tels que Plotly.
Il existe des données payantes, mais la plupart des données peuvent être obtenues gratuitement.
Des bibliothèques dans différentes langues sont également disponibles (https://www.quandl.com/help/libraries), qui vous permettent de récupérer et de récupérer des données à l'aide d'API.
Il existe une page qui non seulement fournit chaque donnée individuellement, mais résume également les données. Si vous cliquez sur Données> Navigateur de données dans le coin supérieur gauche de l'écran, vous pouvez effectuer une recherche par pays ou par type de données. Par exemple, il y a les pages suivantes.
La bibliothèque Quandl peut être installée à l'aide de pip. (Nécessite Numpy et pandas)
$ pip install Quandl
Si vous importez le module Quandl et passez le code Quandl à la fonction get, vous pouvez obtenir les données en tant que DataFrame pandas. Quandl Code s'affiche dans le coin supérieur droit de l'écran lorsque vous recherchez les données.
>>> import Quandl
>>> df = Quandl.get('GOOG/NASDAQ_GOOG')
>>> df[:5]
Open High Low Close Volume
Date
2004-08-19 49.96 51.98 47.93 50.12 NaN
2004-08-20 50.69 54.49 50.20 54.10 NaN
2004-08-23 55.32 56.68 54.47 54.65 NaN
2004-08-24 55.56 55.74 51.73 52.38 NaN
2004-08-25 52.43 53.95 51.89 52.95 NaN
[5 rows x 5 columns]
Si vous n'avez pas de compte Quandl, vous êtes limité à utiliser l'API 50 fois par jour. Vous pouvez utiliser l'API de manière illimitée en enregistrant un compte avec Quandl et en transmettant le jeton affiché sur la page du compte ensemble.
>>> df = Quandl.get('GOOG/NASDAQ_GOOG', authtoken='YOUR_AUTH_TOKEN')
Plusieurs données peuvent être acquises en même temps en passant une liste de code Quandl comme argument comme indiqué dans l'exemple ci-dessous. Ceci est pratique lorsque vous souhaitez comparer des données.
>>> df = Quandl.get(["WORLDBANK/JPN_IT_NET_USER_P2",
... "WORLDBANK/KOR_IT_NET_USER_P2",
... "WORLDBANK/CHN_IT_NET_USER_P2"])
>>> df.columns = ["Japan", "Korea", "China"]
>>> df[:5]
Japan Korea China
Date
1990-12-31 0.020294 0.023265 0.000000
1991-12-31 0.040438 0.046124 NaN
1992-12-31 0.096678 0.098404 NaN
1993-12-31 0.401278 0.249947 0.000169
1994-12-31 0.799684 0.311359 0.001168
Vous pouvez rechercher des données à l'aide de la fonction de recherche. verbose est True par défaut, et si True, les 4 premières données sont sorties vers la sortie standard.
>>> dataset = Quandl.search("Internet User", source="WORLDBANK", verbose=False)
Si le nombre de résultats est important, les pages sont divisées, il est donc nécessaire de spécifier le nombre de pages et d'exécuter à plusieurs reprises. Notez que s'il y a trop de pages, vous risquez d'être pris dans la limitation.
>>> page = 0
>>> dataset = []
>>> import itertools as it
>>> for page in it.count():
... d = Quandl.search("Internet User", page=page, source="WORLDBANK", verbose=False)
... if not d:
... break
... dataset.extend(d)
C'est fondamentalement la même chose que la recherche avec un navigateur, mais si vous voulez obtenir le code Quandl en même temps, il peut être plus facile d'utiliser l'API.
Voir la documentation pour d'autres détails sur l'API.
Consultez la documentation de l'API pour les options non prises en charge par la bibliothèque Python. Vous pouvez également l'utiliser en ouvrant l'URL directement en utilisant urllib2 etc.
Recommended Posts