Einführung

Die Code-Erklärung selbst in diesem Artikel richtet sich an Anfänger in der Python-Programmierung.

Auf der Website für dreifache Vorhersagen für Bootsrennen "Ist heute eine gute Vorhersage" werden die Trefferquote und die Wiederherstellungsrate der täglichen Rennvorhersagen ohne Verstecken bekannt gegeben. Ich wollte jedoch die täglichen Prognoseergebnisse einmal im Monat in einem zusammenfassen, also dachte ich darüber nach, wie der Titel zu verarbeiten.

Meine Situation

Wir organisieren die Ergebnisse von Bootsrennen und Vorhersagen zum maschinellen Lernen und speichern sie täglich in einem Format wie "result_2020mmdd.csv". Ich möchte diese Dateien einmal im Monat zusammenstellen und die Ergebnisse visualisieren ...

Und ich möchte die Dateien wie result_202006 .. ** _ test ** .csv weglassen, die hier und da gemischt werden, wie in der folgenden Abbildung gezeigt, weil sie zum Testen dienen.

Der Code sieht so aus.

Es ist sehr einfach.


import pandas as pd
import glob

csv_files = glob.glob("predict/result/result_202006??.csv")
filelist = []
for file in csv_files:
    filelist.append(pd.read_csv(file))

df = pd.concat(filelist)

Wenn ich den Pfadnamen mit glob erhalte, verwende ich result_202006 ** ?? ** .csv. Eins? Übernimmt die Verantwortung für einen Charakter.

csv_files hat eine schöne Reihe von Dateien + Pfadnamen.

Fügen Sie eins nach dem anderen die for-Anweisung hinzu und machen Sie es schließlich zu einem DataFrame und vervollständigen Sie es! ist.

Übrigens, wie war das Ergebnis im Juni ..

Ich habe das Ergebnis mit dem zuvor erstellten Datenrahmen überprüft. Die Trefferquote bei drei Einheiten betrug wie geplant 10%, aber die Wiederherstellungsrate liegt bei etwas mehr als 80% ... (Wenn Sie sich jedoch andere kostenlose Prognosen ansehen, scheint es, als könnten Sie an diesem Punkt noch kämpfen.)

Hier ist das Ergebnis der Organisation mit pivot_table nach der Zusammenfassung. ** Es ist interessant, dass die Rennstrecken, die leicht zu treffen sind, und die Rennstrecken, die überhaupt nicht zu treffen sind, klar sind. ** ** ** Kaufen wir nur die Bootsrennen, die diesen Monat leicht zu treffen sind.

Site	Hit	Miss	Payoff	Return_ratio
Marugame	5	26	5480	176.77
Gamagun	3	21	3990	166.25
Tokuyama	9	33	6800	161.9
Biwa See	9	31	5810	145.25
Hamana-See	8	43	6030	118.24
Toda	4	46	5470	109.4
Edogawa	3	24	2740	101.48
Naruto	6	44	5060	101.2
Tokisuri	4	38	4190	99.76
Kojima	5	58	6230	98.89
Suminoe	2	33	3340	95.43
Fukuoka	2	14	1460	91.25
Ashiya	6	46	4540	87.31
Omura	8	51	4770	80.85
Karatsu	3	30	2600	78.79
Amagasaki	5	52	4270	74.91
Miyajima	5	36	2400	58.54
Friedensinsel	3	40	2510	58.37
Tama River	3	32	1850	52.86
Shimonoseki	3	54	2760	48.42
Drei Länder	5	58	3030	48.1
Wakamatsu	4	56	1780	29.67
Kiryu	1	47	1190	24.79
Tsu	3	67	1290	18.43

[PYTHON] Erwerben Sie mit Glob mehrere Excels gleichzeitig (Borace-Ergebnis für maschinelles Lernen, Bestätigung für Juni)

Einführung

Meine Situation

Der Code sieht so aus.

Übrigens, wie war das Ergebnis im Juni ..