Même si vous êtes un débutant en python et que vous avez moins d'un an de courses de chevaux, vous avez pu gagner un triple.

** Introduction **

Je suis désolé, mais je vais omettre l'explication des termes de courses de chevaux. Je pense que les gens qui s'intéressent aux courses de chevaux le lisent.

Informations publiées sur netkeiba.com (informations obtenues par grattage) Il existe différents pedigrees, temps de course, kilométrage, etc. Comme prémisse, les données grattées sont utilisées telles quelles comme modèle Je n'attends rien quand je l'adapte. Nous devons trier, organiser et analyser les informations.

Avant de décider d'une politique d'analyse des données, d'abord comme hypothèse

** Il y a eu diverses choses du début de la course à la dernière ligne droite, mais le cheval a couru avec toute la puissance restante dans la montée 3 halons L'ordre d'arrivée est décidé dans l'ordre de passage de l'objectif **

ça ira. Cela peut sembler évident, mais cela restreint les informations à prendre en compte. Les données que j'utilise pour procéder à l'analyse sont

·chrono → Évaluer le rythme de toute la course et le grade de la course ・ Turf de type course ou terre / distance → Subdiviser de nombreux types de races

Données pour chaque cheval ・ Ordre de passage de coin pour chaque cheval, 3 fois plus → Classement de la qualité des pattes, évaluation de la dernière ligne droite chez les chevaux de même qualité de pattes

Supplément 1: Le cavalier, le nom du cheval, le pedigree, l'ordre du cadre, le temps de course, etc. ne sont pas pris en compte. Supplément 2: Faire ses débuts en course n'est pas inclus dans l'analyse car il ne tient pas compte du pedigree et du jockey.

Comme mentionné ci-dessus, c'était une longue introduction.

** À propos du travail de prévision réel **

Maintenant, créons des données d'entraînement pour l'IA afin de prédire la course. Il est inutile de créer des données pour les chevaux inférieurs car il ne s'implique pas dans les paris sur les billets. Créez des données avec 1 à 6 chevaux lors de courses passées.

Exemple: scr.csv scr.jpg train.csv train.jpg

Juste quelques lignes.

Données de ligne récupérées par scr. Train calculé comme le rangement et l'écart type (données d'entraînement) Même si cela pose problème, écrivez fermement un nouveau fichier csv.

Si vous créez correctement les données d'entraînement, vous obtiendrez de bons résultats sans avoir à modifier les paramètres du modèle. Je joue avec.

Avec les données dérivées de ce modèle, j'ai acheté une boîte à 4 têtes et j'ai pu frapper le cheval simple et le triple simple. Prévisions publiées sur un certain site central de prédiction des courses de chevaux tekichu.jpg

Même dans la course que j'ai supprimée, je pense que j'ai pu faire quelque chose d'assez bon, avec deux d'entre eux en troisième position. hazushi.jpg

** Post-scriptum **

Que peut-on faire comme mesure d'amélioration ・ Pedigree ・ Cavalier ・ Ordre des cadres ・ Saison ・ Caractéristiques négatives

Construire des prédictions basées sur le pedigree et le jockey est le vrai frisson des courses de chevaux, alors je veux le faire un jour. Mais je ne peux même pas imaginer comment le faire. Est-il possible de compter les cavaliers et les pères et mères qui sont à la troisième place de la course? Explorant. L'ordre du cadre n'est pas non plus pertinent, même si l'on dit que le gazon a un avantage dans le cadre intérieur. On dit que le cadre extérieur est plus avantageux en saleté car le sol de conduite n'est pas accidenté. Y a-t-il une différence de puissance entre l'étalon et la chevalière pendant la période œstrale selon la saison? Je n'ai pas couru depuis moins d'un an, donc honnêtement je ne sais pas du tout. Je pense que les data scientists échangeront leurs opinions sur ce domaine avec un oncle qui aime les courses de chevaux.

La quantité de caractéristique négative est l'esprit d'essayer de rôtir un cheval qui sera sûrement 4e ou moins. L'objectif est d'éviter de gaspiller de l'argent sur des chevaux populaires dangereux et des chevaux furtifs. Aussi, en faisant des pronostics sous d'autres angles, nous pourrons avoir plus confiance dans les quatre chevaux qui achèteront la BOX.

Le langage de développement est python et le framework est le notebook AWS / Cloud9 / jupyter. J'aimerais écrire un article lorsque je peux me permettre le code détaillé. Les prévisions actuelles sont ouvertes au public sur le site Regimagu, alors venez nous rendre visite.

Recommended Posts

Même si vous êtes un débutant en python et que vous avez moins d'un an de courses de chevaux, vous avez pu gagner un triple.
Si vous voulez un singleton en python, considérez le module comme un singleton
[Python] N'est-ce pas le plus élevé et le plus élevé si vous pouvez saisir les caractéristiques d'une entreprise avec nlplot?
Si vous définissez une méthode dans une classe Ruby, puis définissez une méthode dans celle-ci, elle devient une méthode de la classe d'origine.
Si vous êtes intéressé par les data scientists, regardez d'abord ici, un résumé de la littérature et des vidéos (ajoutées au besoin)
Si vous rencontrez une "erreur de décodage Unicode" en Python
Si vous tirez une loterie avec 1% de chances d'apparaître 100 fois de suite, gagnerez-vous une fois?
Pourquoi l'instruction main () -if de Python est-elle attachée?
Voici quelques grammaires que vous pourriez obtenir un slapstick si vous connaissez en Python
Si vous êtes novice en programmation, pourquoi ne pas créer un "jeu" pour le moment? L'histoire