[PYTHON] Erwerben Sie mit Glob mehrere Excels gleichzeitig (Borace-Ergebnis für maschinelles Lernen, Bestätigung für Juni)

Einführung

Auf der Website für dreifache Vorhersagen für Bootsrennen "Ist heute eine gute Vorhersage" werden die Trefferquote und die Wiederherstellungsrate der täglichen Rennvorhersagen ohne Verstecken bekannt gegeben. Ich wollte jedoch die täglichen Prognoseergebnisse einmal im Monat in einem zusammenfassen, also dachte ich darüber nach, wie der Titel zu verarbeiten.

Meine Situation

Wir organisieren die Ergebnisse von Bootsrennen und Vorhersagen zum maschinellen Lernen und speichern sie täglich in einem Format wie "result_2020mmdd.csv". Ich möchte diese Dateien einmal im Monat zusammenstellen und die Ergebnisse visualisieren ...

Und ich möchte die Dateien wie result_202006 .. ** _ test ** .csv weglassen, die hier und da gemischt werden, wie in der folgenden Abbildung gezeigt, weil sie zum Testen dienen.

image.png

Der Code sieht so aus.

Es ist sehr einfach.


import pandas as pd
import glob

csv_files = glob.glob("predict/result/result_202006??.csv")
filelist = []
for file in csv_files:
    filelist.append(pd.read_csv(file))

df = pd.concat(filelist)

Wenn ich den Pfadnamen mit glob erhalte, verwende ich result_202006 ** ?? ** .csv. Eins? Übernimmt die Verantwortung für einen Charakter.

csv_files hat eine schöne Reihe von Dateien + Pfadnamen. image.png

Fügen Sie eins nach dem anderen die for-Anweisung hinzu und machen Sie es schließlich zu einem DataFrame und vervollständigen Sie es! ist.

Übrigens, wie war das Ergebnis im Juni ..

Ich habe das Ergebnis mit dem zuvor erstellten Datenrahmen überprüft. Die Trefferquote bei drei Einheiten betrug wie geplant 10%, aber die Wiederherstellungsrate liegt bei etwas mehr als 80% ... (Wenn Sie sich jedoch andere kostenlose Prognosen ansehen, scheint es, als könnten Sie an diesem Punkt noch kämpfen.)

image.png

Hier ist das Ergebnis der Organisation mit pivot_table nach der Zusammenfassung. ** Es ist interessant, dass die Rennstrecken, die leicht zu treffen sind, und die Rennstrecken, die überhaupt nicht zu treffen sind, klar sind. ** ** ** Kaufen wir nur die Bootsrennen, die diesen Monat leicht zu treffen sind.

Site Hit Miss Payoff Return_ratio
Marugame 5 26 5480 176.77
Gamagun 3 21 3990 166.25
Tokuyama 9 33 6800 161.9
Biwa See 9 31 5810 145.25
Hamana-See 8 43 6030 118.24
Toda 4 46 5470 109.4
Edogawa 3 24 2740 101.48
Naruto 6 44 5060 101.2
Tokisuri 4 38 4190 99.76
Kojima 5 58 6230 98.89
Suminoe 2 33 3340 95.43
Fukuoka 2 14 1460 91.25
Ashiya 6 46 4540 87.31
Omura 8 51 4770 80.85
Karatsu 3 30 2600 78.79
Amagasaki 5 52 4270 74.91
Miyajima 5 36 2400 58.54
Friedensinsel 3 40 2510 58.37
Tama River 3 32 1850 52.86
Shimonoseki 3 54 2760 48.42
Drei Länder 5 58 3030 48.1
Wakamatsu 4 56 1780 29.67
Kiryu 1 47 1190 24.79
Tsu 3 67 1290 18.43

Recommended Posts

Erwerben Sie mit Glob mehrere Excels gleichzeitig (Borace-Ergebnis für maschinelles Lernen, Bestätigung für Juni)
Verstärken Sie Bilder für maschinelles Lernen mit Python
[Shakyo] Begegnung mit Python zum maschinellen Lernen
Aktualisieren Sie mehrere Tabellen gleichzeitig mit pandas to_sql
Konvertieren Sie mehrere Protodateien gleichzeitig mit Python