[PYTHON] Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.

Es wird davon ausgegangen, dass Sie das Verstärkungslernen abgeschlossen haben 13. Wenn Sie Pendulum-v0 in das Jupyter-Notizbuch zur Stärkung des Lernens 13 einfügen, ... Ist nutzlos. Siehe das ChainerRL / GitHub-Beispiel. https://github.com/chainer/chainerrl/tree/master/examples/gym

train_dqn_gym.py selbst lieferte bessere Ergebnisse. Umgeschrieben (26. November) Bitte fliegen Sie zur Stärkung des Lernens 20.

Recommended Posts

Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.
Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL
Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C
Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL
Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL
Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL
Stärkung des Lernens 2 Installation von Chainerrl
Verstärkungslernen 9 ChainerRL Magic Remodeling
Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C
Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER
Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
[Einführung] Stärkung des Lernens
Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version
Zukünftiges Verstärkungslernen_1
Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)
Erweitertes Lernen 1 Python-Installation
Stärkung des Lernens 3 OpenAI-Installation
Stärkung des Lernens der dritten Zeile
[Lernen stärken] Banditenaufgabe
Python + Unity Enhanced Learning (Lernen)
Stärkung des Lernens 1 Einführungsausgabe