[PYTHON] Datenrabatfluss für Pferderennen

Erstens, wie im vorherigen Artikel, haben es überraschend viele Menschen gelesen und gemocht. Ich bin sehr dankbar und zittere Ab diesem Zeitpunkt werde ich kurz einen Artikel darüber schreiben, welche Art von Code ich geschrieben habe.

Pferderenndaten können grob in Informationen über das gesamte Rennen und Informationen über die Pferde, die am Rennen teilgenommen haben, unterteilt werden. Schneiden Sie nicht nur das Zielteil plötzlich aus, sondern versuchen Sie es einmal mit einem großen Druck. Ich habe noch keinen Text hinzugefügt

Zum Beispiel im Fall der folgenden Seite sankou.jpg (Von netkeiba.com)

Die Art des Kurses, die Laufleistung und die Fahrbedingungen sind im roten Rahmen angegeben, daher möchte ich sie erwerben. Wenn Sie schöne Suop verwenden

scr1.py


from bs4 import BeautifulSoup

id = '201806010101'#Renn-ID, für die Sie Daten erfassen möchten
url = ('https://db.netkeiba.com/race/%s/' % (id))
response = request.urlopen(url)
bs = BeautifulSoup(response, 'html.parser')

raceinfo = bs.select("span")[6]
print(raceinfo)
#<span>Da rechts 1200m/das Wetter:Fein/Schmutz:Gut/Start: 09:55</span>

Fügen Sie hier zum ersten Mal .text oder .split hinzu

scr2.py


import re

racetype = raceinfo.text.split()[0][:1]
length = re.sub("\\D", "", raceinfo.text.split()[0])
conde = raceinfo.text.split()[8]
print(racetype,length,conde)
#Da 1200 gut

Ich konnte die gewünschten Informationen wie Kurstyp, Kilometerstand und Fahrbedingungen abrufen.

Dies hat den Vorteil, dass, wenn Sie beim Schleifen Variablen in der ersten großen Schleife verwenden, die anderen Ist es möglich, Daten reibungslos zu erfassen, und ist es einfach, den Zahlen in der Liste einen Treffer hinzuzufügen? Informationen zu anderen Rassen und Informationen zu jedem Pferd sollten auf die gleiche Weise eingeholt werden.

Es ist auch am besten, die Daten der letzten 10 Jahre nicht gleichzeitig zu kratzen. Teilen Sie es mehrmals auf und hängen Sie es mit .concat oder .append an, wenn Sie über die Daten verfügen. Es fühlt sich gut an, es jedes Jahr zu tun (Wenn Sie es ausführen, wenn Sie ins Bett gehen oder zur Arbeit gehen, wird es normalerweise eine Zeitüberschreitung geben ...)

Wenn Sie es erhalten, möchten Sie es mit einigen Berechnungen speichern, aber lassen Sie es uns später tun. Es ist eine zeitaufwändige Aufgabe, also ...

Die Renn- und Pferdedaten wurden gemäß dem obigen Fluss getrennt erfasst.

Diesmal ist es kurz, aber ich hole nur Informationen und habe nichts Besonderes getan, also ist es soweit. Als nächstes werde ich darüber schreiben, wie man Daten organisiert, Rennen fährt und Pferde bewertet. Ab dem nächsten Artikel wird es viele Begriffe für Pferderennen geben, aber ich werde so viel wie möglich erklären.

Recommended Posts

Datenrabatfluss für Pferderennen
Scrapping von Pferderenndaten im Colaboratory
Pferderennseite Web Scraping mit Python
Python-Scraping Extrahieren Sie die Rennumgebung von der Pferderennseite
So kratzen Sie Pferderenndaten mit Beautiful Soup
[Python] Fluss vom Web-Scraping zur Datenanalyse
Wie man Pferderenndaten mit pandas read_html kratzt
Ich habe versucht, den Pferderennplatz Teil 2 zu kriechen und abzukratzen
Holen Sie sich vergangene Leistung von Läufern von Python Scraping Pferderennen Website
Programmieren Sie die Gewinnmethode für Pferderennen
Versuchen Sie, Pferderennen mit Chainer vorherzusagen
Ich habe das Schaben mit Selen gelernt, um ein Vorhersagemodell für Pferderennen zu erstellen.