[PYTHON] Acquérir plusieurs Excels à la fois avec glob (résultat de la prédiction d'apprentissage automatique Borace, confirmation pour juin)

introduction

Sur le site de triple prédiction de course de bateaux "Aujourd'hui, est-ce une bonne prédiction?", le taux de réussite et le taux de récupération des pronostics quotidiens de course sont divulgués sans se cacher. Cependant, je voulais résumer les résultats des prévisions quotidiennes en un une fois par mois, alors j'ai pensé à un traitement comme le titre.

Ma situation

Nous organisons les résultats des courses de bateaux et des prévisions d'apprentissage automatique et les sauvegardons quotidiennement dans un format tel que "result_2020mmdd.csv". Je souhaite rassembler ces fichiers une fois par mois et visualiser les résultats ...

Et je veux omettre les fichiers comme result_202006 .. ** _ test ** .csv qui sont mélangés ici et là comme le montre la figure ci-dessous car ils sont à tester.

image.png

Le code ressemble à ceci.

C'est très simple.


import pandas as pd
import glob

csv_files = glob.glob("predict/result/result_202006??.csv")
filelist = []
for file in csv_files:
    filelist.append(pd.read_csv(file))

df = pd.concat(filelist)

Lorsque j'obtiens le nom du chemin avec glob, j'utilise result_202006 ** ?? ** .csv. Un? Prendra en charge n'importe quel personnage.

csv_files a un bel ensemble de fichiers + chemins. image.png

Ajoutez un par un avec l'instruction for, et faites-en enfin un DataFrame et terminez! est.

Au fait, comment était le résultat en juin ...

J'ai vérifié le résultat en utilisant le bloc de données que j'ai créé plus tôt. Le taux de réussite des trois unités était de 10% tel que conçu, mais le taux de récupération est légèrement supérieur à 80%. (Cependant, en regardant d'autres prévisions gratuites, il peut sembler que vous pouvez toujours vous battre à ce stade.)

image.png

Voici le résultat de l'organisation avec pivot_table après avoir résumé. ** Il est intéressant de noter que les hippodromes faciles à atteindre et les hippodromes qui ne frappent pas du tout sont clairs. ** ** N'achetons que les courses de bateaux faciles à réaliser ce mois-ci

Site Hit Miss Payoff Return_ratio
Marugame 5 26 5480 176.77
Gamagun 3 21 3990 166.25
Tokuyama 9 33 6800 161.9
Lac Biwa 9 31 5810 145.25
Lac Hamana 8 43 6030 118.24
Toda 4 46 5470 109.4
Edogawa 3 24 2740 101.48
Naruto 6 44 5060 101.2
Tokisuri 4 38 4190 99.76
Kojima 5 58 6230 98.89
Suminoe 2 33 3340 95.43
Fukuoka 2 14 1460 91.25
Ashiya 6 46 4540 87.31
Omura 8 51 4770 80.85
Karatsu 3 30 2600 78.79
Amagasaki 5 52 4270 74.91
Miyajima 5 36 2400 58.54
Île de la Paix 3 40 2510 58.37
Rivière Tama 3 32 1850 52.86
Shimonoseki 3 54 2760 48.42
Trois pays 5 58 3030 48.1
Wakamatsu 4 56 1780 29.67
Kiryu 1 47 1190 24.79
Tsu 3 67 1290 18.43

Recommended Posts

Acquérir plusieurs Excels à la fois avec glob (résultat de la prédiction d'apprentissage automatique Borace, confirmation pour juin)
Amplifiez les images pour l'apprentissage automatique avec Python
[Shakyo] Rencontre avec Python pour l'apprentissage automatique
Mettre à jour plusieurs tables à la fois avec pandas to_sql
Convertissez plusieurs fichiers proto à la fois avec python