[PYTHON] Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.

Es wird davon ausgegangen, dass Sie bis zu 10 Bestärkungslernen erreicht haben. Wenn Sie mit openai acrobot googeln, wird Acrobot-v1 veröffentlicht. Ich bin mir bei v1 oder v0 nicht sicher, daher werde ich dies vor dem Umbau untersuchen. userfolder/anaconda3/envs/chainer/lib/python3.7/site-packages/gym Mit VS Code. Eine vollständige Suche auf CartPole ergab CartPole-v0 und CartPole-v1. Hmmm? In Acrobot nur Acrobot-v1. Ich habe versucht, CartPole-v0 anstelle von CartPole-v1 mit dem zuvor erstellten CartPole auszuführen. Es scheint, dass der Schwierigkeitsgrad zunimmt.

Ich habe es so ersetzt, wie es war, aber etwas war anders. .. .. .. Acrobot ist eine Pendelbewegung, und Sie können eine Belohnung für den Erfolg erhalten, indem Sie sie auf eine bestimmte Höhe bringen. Stellen wir es so ein, dass der Wert in der Zukunft nicht sehr stark reduziert wird. Ich habe Gamma auf 0,99 eingestellt und es scheint zu funktionieren.

Ich benutze DQN (Deep Q Network). Es gibt viele Erklärungen, daher ist es eine gute Idee, zu googeln.

Recommended Posts

Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Stärkung des Lernens 3 OpenAI-Installation
[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken
Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL
Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL
Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL
Stärkung des Lernens 2 Installation von Chainerrl
Versuchen Sie, CNN mit ChainerRL auszuführen
Versuchen Sie Deep Learning mit FPGA
Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?
Verstärkungslernen 9 ChainerRL Magic Remodeling
Versuchen Sie es mit Kaggle leicht maschinell
Verstärkungslernen in kürzester Zeit mit Keras mit OpenAI Gym
Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C
Versuchen Sie es mit TensorFlow Part 2
Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C
Entdecken Sie das Labyrinth mit erweitertem Lernen
SVM versucht maschinelles Lernen mit Scikit-Learn
Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden
Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER
Versuchen Sie Common Representation Learning mit Chainer
Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert
[Stärkung des Lernens] DQN mit Ihrer eigenen Bibliothek
Probieren Sie die Bitcoin-Preisprognose mit Deep Learning aus
Versuchen Sie es mit Chainer Deep Q Learning - Launch
Versuchen Sie mit Kipoi tiefes Erlernen der Genomik
Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.
[Python] Probieren Sie mit Keras-RL ganz einfach erweitertes Lernen (DQN) aus
[Einführung] Stärkung des Lernens
Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.
Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version
Zukünftiges Verstärkungslernen_2
Zukünftiges Verstärkungslernen_1
Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)
Herausforderung Blockbruch mit Actor-Critic-Modell zur Stärkung des Lernens
Ich möchte mit verstärkendem Lernen einen Berg besteigen
Verstärkungslernen 37 Starten Sie automatisch mit Ataris Wrapper
Versuchen Sie es mit Python.
Python lernen mit ChemTHEATER 03
"Objektorientiert" mit Python gelernt
Erweitertes Lernen 1 Python-Installation
Python lernen mit ChemTHEATER 05-1
Stärkung des Lernens der dritten Zeile
Python lernen mit ChemTHEATER 02
Python lernen mit ChemTHEATER 01
Versuchen Sie SNN mit BindsNET
Python + Unity Enhanced Learning (Lernen)
Versuchen Sie, eine Blackjack-Strategie zu entwickeln, indem Sie das Lernen stärken (③ Stärkung des Lernens in Ihrer eigenen OpenAI Gym-Umgebung).
Versuchen Sie eine Regression mit TensorFlow
[Maschinelles Lernen] Starten Sie Spark mit iPython Notebook und probieren Sie MLlib aus
Versuchen Sie, ein Deep Learning / Neuronales Netzwerk mit Scratch aufzubauen
[Evangelion] Versuchen Sie, mit Deep Learning automatisch Asuka-ähnliche Linien zu erzeugen
[Einführung in die Stärkung des Lernens] Stärkung des Lernens, um sich vorerst zu bewegen
Versuchen Sie Q-Lernen in einem Kampf im Drakue-Stil [Einführung in die Stärkung des Lernens]
Reinforcement Learning 23 Erstellen und verwenden Sie Ihr eigenes Modul mit Colaboratory