Je suis désolé, mais je vais omettre l'explication des termes de courses de chevaux. Je pense que les gens qui s'intéressent aux courses de chevaux le lisent.
Informations publiées sur netkeiba.com (informations obtenues par grattage) Il existe différents pedigrees, temps de course, kilométrage, etc. Comme prémisse, les données grattées sont utilisées telles quelles comme modèle Je n'attends rien quand je l'adapte. Nous devons trier, organiser et analyser les informations.
Avant de décider d'une politique d'analyse des données, d'abord comme hypothèse
** Il y a eu diverses choses du début de la course à la dernière ligne droite, mais le cheval a couru avec toute la puissance restante dans la montée 3 halons L'ordre d'arrivée est décidé dans l'ordre de passage de l'objectif **
ça ira. Cela peut sembler évident, mais cela restreint les informations à prendre en compte. Les données que j'utilise pour procéder à l'analyse sont
·chrono → Évaluer le rythme de toute la course et le grade de la course ・ Turf de type course ou terre / distance → Subdiviser de nombreux types de races
Données pour chaque cheval ・ Ordre de passage de coin pour chaque cheval, 3 fois plus → Classement de la qualité des pattes, évaluation de la dernière ligne droite chez les chevaux de même qualité de pattes
Supplément 1: Le cavalier, le nom du cheval, le pedigree, l'ordre du cadre, le temps de course, etc. ne sont pas pris en compte. Supplément 2: Faire ses débuts en course n'est pas inclus dans l'analyse car il ne tient pas compte du pedigree et du jockey.
Comme mentionné ci-dessus, c'était une longue introduction.
Maintenant, créons des données d'entraînement pour l'IA afin de prédire la course. Il est inutile de créer des données pour les chevaux inférieurs car il ne s'implique pas dans les paris sur les billets. Créez des données avec 1 à 6 chevaux lors de courses passées.
Exemple: scr.csv train.csv
Juste quelques lignes.
Données de ligne récupérées par scr. Train calculé comme le rangement et l'écart type (données d'entraînement) Même si cela pose problème, écrivez fermement un nouveau fichier csv.
Si vous créez correctement les données d'entraînement, vous obtiendrez de bons résultats sans avoir à modifier les paramètres du modèle. Je joue avec.
Avec les données dérivées de ce modèle, j'ai acheté une boîte à 4 têtes et j'ai pu frapper le cheval simple et le triple simple. Prévisions publiées sur un certain site central de prédiction des courses de chevaux
Même dans la course que j'ai supprimée, je pense que j'ai pu faire quelque chose d'assez bon, avec deux d'entre eux en troisième position.
Que peut-on faire comme mesure d'amélioration ・ Pedigree ・ Cavalier ・ Ordre des cadres ・ Saison ・ Caractéristiques négatives
Construire des prédictions basées sur le pedigree et le jockey est le vrai frisson des courses de chevaux, alors je veux le faire un jour. Mais je ne peux même pas imaginer comment le faire. Est-il possible de compter les cavaliers et les pères et mères qui sont à la troisième place de la course? Explorant. L'ordre du cadre n'est pas non plus pertinent, même si l'on dit que le gazon a un avantage dans le cadre intérieur. On dit que le cadre extérieur est plus avantageux en saleté car le sol de conduite n'est pas accidenté. Y a-t-il une différence de puissance entre l'étalon et la chevalière pendant la période œstrale selon la saison? Je n'ai pas couru depuis moins d'un an, donc honnêtement je ne sais pas du tout. Je pense que les data scientists échangeront leurs opinions sur ce domaine avec un oncle qui aime les courses de chevaux.
La quantité de caractéristique négative est l'esprit d'essayer de rôtir un cheval qui sera sûrement 4e ou moins. L'objectif est d'éviter de gaspiller de l'argent sur des chevaux populaires dangereux et des chevaux furtifs. Aussi, en faisant des pronostics sous d'autres angles, nous pourrons avoir plus confiance dans les quatre chevaux qui achèteront la BOX.
Le langage de développement est python et le framework est le notebook AWS / Cloud9 / jupyter. J'aimerais écrire un article lorsque je peux me permettre le code détaillé. Les prévisions actuelles sont ouvertes au public sur le site Regimagu, alors venez nous rendre visite.