Es wird davon ausgegangen, dass Sie das Verstärkungslernen abgeschlossen haben 13. Wenn Sie Pendulum-v0 in das Jupyter-Notizbuch zur Stärkung des Lernens 13 einfügen, ... Ist nutzlos. Siehe das ChainerRL / GitHub-Beispiel. https://github.com/chainer/chainerrl/tree/master/examples/gym
train_dqn_gym.py selbst lieferte bessere Ergebnisse. Umgeschrieben (26. November) Bitte fliegen Sie zur Stärkung des Lernens 20.
Recommended Posts