Es wird davon ausgegangen, dass Sie die Stärkung des Lernens abgeschlossen haben 8.
In Strengthing Learning 8 wurde die Chainer-Benutzeroberfläche umgestaltet. Das ist in Ordnung, aber diesmal mache ich dasselbe mit ChainerRL.
Zuerst, userFolder/anaconda3/envs/chainer/lib/python3.7/site-packages/chainerrl/experiments/evaluator.py Ändern Sie die 31. Zeile von.
Vorher ändern
_basic_columns = ('steps', 'episodes', 'elapsed', 'mean',
'median', 'stdev', 'max', 'min')
Nach der veränderung
_basic_columns = ('step', 'episode', 'elapsed_time', 'mean',
'median', 'stdev', 'max', 'min')
Dadurch wird der Header score.txt geändert, sodass Sie die ChainerRL nicht ändern müssen.
der andere ist, userFolder / anaconda3 / envs / chainer / lib / python3.7 / site-packages / chainerrl / Experiments / train_agent.py Fügen Sie es am Ende der Funktion def train_agent_with_evaluation in Zeile 93 hinzu. Da Python mit Einrückungen arbeitet, müssen Sie beim Einrücken vorsichtig sein.
json_list = []
with open(os.path.join(outdir, 'scores.txt'), 'r') as f:
for row in csv.DictReader(f,delimiter='\t'):
for key in row:
row[key]=float(row[key])
json_list.append(row)
with open(os.path.join(outdir, 'log'), 'w') as f:
json.dump(json_list, f)
Fügen Sie auch Import hinzu.
import json
import csv
Wenn Sie es umbauen, können Sie es leicht auf der normalen Chainer-Benutzeroberfläche sehen. Ich hoffe, dass die Chainer RL-Kopffamilie es auch unterstützt. Da Fenster etwas anders sind, werde ich sie in Enhanced Learning 12 zusammen schreiben.
Recommended Posts