[PYTHON] Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.

Es wird davon ausgegangen, dass Sie bis zu 10 Bestärkungslernen erreicht haben. Wenn Sie mit openai acrobot googeln, wird Acrobot-v1 veröffentlicht. Ich bin mir bei v1 oder v0 nicht sicher, daher werde ich dies vor dem Umbau untersuchen. userfolder/anaconda3/envs/chainer/lib/python3.7/site-packages/gym Mit VS Code. Eine vollständige Suche auf CartPole ergab CartPole-v0 und CartPole-v1. Hmmm? In Acrobot nur Acrobot-v1. Ich habe versucht, CartPole-v0 anstelle von CartPole-v1 mit dem zuvor erstellten CartPole auszuführen. Es scheint, dass der Schwierigkeitsgrad zunimmt.

Ich habe es so ersetzt, wie es war, aber etwas war anders. .. .. .. Acrobot ist eine Pendelbewegung, und Sie können eine Belohnung für den Erfolg erhalten, indem Sie sie auf eine bestimmte Höhe bringen. Stellen wir es so ein, dass der Wert in der Zukunft nicht sehr stark reduziert wird. Ich habe Gamma auf 0,99 eingestellt und es scheint zu funktionieren.

Ich benutze DQN (Deep Q Network). Es gibt viele Erklärungen, daher ist es eine gute Idee, zu googeln.

Recommended Posts

Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.

Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.

Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL

Stärkung des Lernens 3 OpenAI-Installation

[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken

Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL

Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL

Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL

Stärkung des Lernens 2 Installation von Chainerrl

Versuchen Sie, CNN mit ChainerRL auszuführen

Versuchen Sie Deep Learning mit FPGA

Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?

Verstärkungslernen 9 ChainerRL Magic Remodeling

Versuchen Sie es mit Kaggle leicht maschinell

Verstärkungslernen in kürzester Zeit mit Keras mit OpenAI Gym

Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C

Versuchen Sie es mit TensorFlow Part 2

Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C

Entdecken Sie das Labyrinth mit erweitertem Lernen

SVM versucht maschinelles Lernen mit Scikit-Learn

Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden

Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER

Versuchen Sie Common Representation Learning mit Chainer

Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert

[Stärkung des Lernens] DQN mit Ihrer eigenen Bibliothek

Probieren Sie die Bitcoin-Preisprognose mit Deep Learning aus

Versuchen Sie es mit Chainer Deep Q Learning - Launch

Versuchen Sie mit Kipoi tiefes Erlernen der Genomik

Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.

[Python] Probieren Sie mit Keras-RL ganz einfach erweitertes Lernen (DQN) aus

[Einführung] Stärkung des Lernens

Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.

Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version

Zukünftiges Verstärkungslernen_2

Zukünftiges Verstärkungslernen_1

Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)

Herausforderung Blockbruch mit Actor-Critic-Modell zur Stärkung des Lernens

Ich möchte mit verstärkendem Lernen einen Berg besteigen

Verstärkungslernen 37 Starten Sie automatisch mit Ataris Wrapper

Versuchen Sie es mit Python.

Python lernen mit ChemTHEATER 03

"Objektorientiert" mit Python gelernt

Erweitertes Lernen 1 Python-Installation

Python lernen mit ChemTHEATER 05-1

Stärkung des Lernens der dritten Zeile

Python lernen mit ChemTHEATER 02

Python lernen mit ChemTHEATER 01

Versuchen Sie SNN mit BindsNET

Python + Unity Enhanced Learning (Lernen)

Versuchen Sie, eine Blackjack-Strategie zu entwickeln, indem Sie das Lernen stärken (③ Stärkung des Lernens in Ihrer eigenen OpenAI Gym-Umgebung).

Versuchen Sie eine Regression mit TensorFlow

[Maschinelles Lernen] Starten Sie Spark mit iPython Notebook und probieren Sie MLlib aus

Versuchen Sie, ein Deep Learning / Neuronales Netzwerk mit Scratch aufzubauen

[Evangelion] Versuchen Sie, mit Deep Learning automatisch Asuka-ähnliche Linien zu erzeugen

[Einführung in die Stärkung des Lernens] Stärkung des Lernens, um sich vorerst zu bewegen

Versuchen Sie Q-Lernen in einem Kampf im Drakue-Stil [Einführung in die Stärkung des Lernens]

Reinforcement Learning 23 Erstellen und verwenden Sie Ihr eigenes Modul mit Colaboratory