[PYTHON] Afficher les séries chronologiques TOPIX

Que faire

Tracez la série chronologique TOPIX de Yahoo Finance et observez les changements de l'économie

Quel package utiliser

urllib2 Faites une requête http et obtenez du HTML

urllib2.urlopen(url).read()

lxml xml, analyseur HTML Supposons que la variable html contienne la chaîne html suivante

<table>
<tr><td>aa</td><td>bb</td></tr>
<tr><td>aa</td><td>bb</td></tr>
<tr><td>aa</td><td>bb</td></tr>
</tr>

Vous pouvez afficher le contenu de tous les td avec le code suivant.

root  = lxml.html.fromstring(html)
root.xpath("//table")
for tr in root.xpath("descendant::tr"):
    for td in root.xpath("descendant::td"):
         print td

code

import pylab
import urllib2
import lxml
import lxml.html
import re

dateFr = {"year": 2000, "month":1, "day":1}
dateTo = {"year": 2013, "month":11, "day": 1}

data = []
for page in range(1, 30):
    print page
    url = "http://info.finance.yahoo.co.jp/history/?code=998405.T&sy=%d&sm=%d&sd=%d&ey=%d&em=%d&ed=%d&tm=d&p=%d"
    url = url % (dateFr["year"], dateFr["month"], dateFr["day"], dateTo["year"], dateFr["month"], dateFr["day"], page)

    html = urllib2.urlopen(url).read()
    root = lxml.html.fromstring(html)
    table = root.xpath('//*[contains(concat(" ",normalize-space(@class)," "), " boardFin ")]')[0]

    for tr in table.xpath("descendant::tr"):
        tmp = [td.text for td in tr.xpath("descendant::td")]
        if len(tmp) != 5:
            continue
        begin = float(tmp[1].replace(",", ""))
        high  = float(tmp[2].replace(",", ""))
        low   = float(tmp[3].replace(",", ""))
        end   = float(tmp[4].replace(",", ""))
        data.append([low, high, low, high])
pylab.boxplot(data)
pylab.show()

image

topix.png

Recommended Posts

Afficher les séries chronologiques TOPIX
Décomposition des séries temporelles
Python: analyse des séries chronologiques
Question sur la série chronologique Python
Analyse des séries chronologiques RNN_LSTM1
Analyse des séries chronologiques 1 Principes de base
Diagramme de séries chronologiques / Matplotlib
Enregistrer les séries chronologiques TOPIX au format pickle, csv, Excel
Analyse des séries chronologiques partie 4 VAR
Analyse de séries chronologiques Partie 3 Prévisions
[Python] Tracer des données de séries chronologiques
Analyse de séries chronologiques Partie 1 Autocorrélation
Calcul de la fidélité des clients dans les séries chronologiques
Prédiction de séries chronologiques facile avec Prophet
Python: analyse des séries chronologiques: prétraitement des données des séries chronologiques
Analyse des séries chronologiques
À propos des données de séries chronologiques et du surentraînement
Différenciation des données de séries chronologiques (discrètes)
Statistiques de mouvement pour la prédiction de séries chronologiques
LSTM (1) pour la prédiction de séries chronologiques (pour les débutants)
Prédiction des données de séries chronologiques par projection simplex
Analyse des séries chronologiques 2 Stabilité, modèle ARMA / ARIMA
Prédire les données de séries chronologiques avec un réseau neuronal
Afficher le temps d'attente de Disney avec le bot LINE
J'ai essayé l'analyse de séries chronologiques! (Modèle AR)
Analyse des séries chronologiques Partie 2 AR / MA / ARMA
[Python] Accélère le chargement du fichier CSV de séries chronologiques
Analyse des séries chronologiques 4 Construction du modèle SARIMA
Détection d'anomalies de données chronologiques pour les débutants
matplotlib Ecrire du texte dans un graphique de séries chronologiques
Comment gérer les données de séries chronologiques (mise en œuvre)
Lecture des données de séries chronologiques OpenFOAM et des ensembles de données
Analyse des séries chronologiques n ° 6 Faux retour et partie républicaine
Formater et afficher des données de séries chronologiques avec différentes échelles et unités avec Python ou Matplotlib