Quandl
Ich habe einen Dienst namens Quandl gefunden, den ich gefunden habe, als ich nachgeforscht habe, wie man den Aktienkurs von Quandl mit Python erhält, also habe ich versucht, ihn zu verwenden. Quandl ist eine Suchmaschine für numerische Daten wie Finanzen und Wirtschaft, die Daten aus verschiedenen Quellen durchsuchen und Grafiken und Tabellen anzeigen kann. Die Daten können auch in JSON-, CSV- und anderen Formaten heruntergeladen oder in Dienste wie Plotly importiert werden. Es gibt einige kostenpflichtige Daten, aber die meisten Daten können kostenlos bezogen werden. Es stehen auch Bibliotheken in verschiedenen Sprachen zur Verfügung (https://www.quandl.com/help/libraries), mit denen Sie Daten mithilfe von APIs abrufen und abrufen können. Es gibt eine Seite, die nicht nur die einzelnen Daten einzeln bereitstellt, sondern auch die Daten zusammenfasst. Wenn Sie oben links auf dem Bildschirm auf Daten> Datenbrowser klicken, können Sie nach Land oder Datentyp suchen. Zum Beispiel gibt es die folgenden Seiten.
Die Quandl-Bibliothek kann mit pip installiert werden. (Benötigt Numpy und Pandas)
$ pip install Quandl
Wenn Sie das Quandl-Modul importieren und den Quandl-Code an die Funktion get übergeben, können Sie die Daten als Pandas-DataFrame abrufen. Quandl-Code wird in der oberen rechten Ecke des Bildschirms angezeigt, wenn Sie die Daten durchsuchen.
>>> import Quandl
>>> df = Quandl.get('GOOG/NASDAQ_GOOG')
>>> df[:5]
Open High Low Close Volume
Date
2004-08-19 49.96 51.98 47.93 50.12 NaN
2004-08-20 50.69 54.49 50.20 54.10 NaN
2004-08-23 55.32 56.68 54.47 54.65 NaN
2004-08-24 55.56 55.74 51.73 52.38 NaN
2004-08-25 52.43 53.95 51.89 52.95 NaN
[5 rows x 5 columns]
Wenn Sie kein Quandl-Konto haben, können Sie die API nur 50 Mal am Tag verwenden. Sie können die API unbegrenzt verwenden, indem Sie ein Konto bei Quandl registrieren und das auf der Kontoseite angezeigte Token gemeinsam übergeben.
>>> df = Quandl.get('GOOG/NASDAQ_GOOG', authtoken='YOUR_AUTH_TOKEN')
Es können mehrere Daten gleichzeitig erfasst werden, indem eine Liste von Quandl-Code als Argument übergeben wird, wie im folgenden Beispiel gezeigt. Dies ist praktisch, wenn Sie Daten vergleichen möchten.
>>> df = Quandl.get(["WORLDBANK/JPN_IT_NET_USER_P2",
... "WORLDBANK/KOR_IT_NET_USER_P2",
... "WORLDBANK/CHN_IT_NET_USER_P2"])
>>> df.columns = ["Japan", "Korea", "China"]
>>> df[:5]
Japan Korea China
Date
1990-12-31 0.020294 0.023265 0.000000
1991-12-31 0.040438 0.046124 NaN
1992-12-31 0.096678 0.098404 NaN
1993-12-31 0.401278 0.249947 0.000169
1994-12-31 0.799684 0.311359 0.001168
Mit der Suchfunktion können Sie nach Daten suchen. verbose ist standardmäßig True, und wenn True, werden die Top-4-Daten an die Standardausgabe ausgegeben.
>>> dataset = Quandl.search("Internet User", source="WORLDBANK", verbose=False)
Wenn die Anzahl der Ergebnisse groß ist, werden die Seiten geteilt. Daher muss die Anzahl der Seiten angegeben und wiederholt ausgeführt werden. Beachten Sie, dass bei zu vielen Seiten möglicherweise eine Drosselung auftritt.
>>> page = 0
>>> dataset = []
>>> import itertools as it
>>> for page in it.count():
... d = Quandl.search("Internet User", page=page, source="WORLDBANK", verbose=False)
... if not d:
... break
... dataset.extend(d)
Es ist im Grunde dasselbe wie das Suchen mit einem Browser, aber wenn Sie den Quandl-Code auf einmal erhalten möchten, ist es möglicherweise einfacher, die API zu verwenden.
Weitere API-Details finden Sie in der Dokumentation.
In der API-Dokumentation finden Sie Optionen, die von der Python-Bibliothek nicht unterstützt werden. Sie können es auch verwenden, indem Sie die URL direkt mit urllib2 usw. öffnen.
Recommended Posts