[PYTHON] Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.

On suppose que vous avez réalisé jusqu'à 10 apprentissages par renforcement. Si vous google avec openai acrobot, Acrobot-v1 sortira. Je ne suis pas sûr de la v1 ou de la v0, je vais donc enquêter avant de le remodeler. userfolder/anaconda3/envs/chainer/lib/python3.7/site-packages/gym Avec VS Code. Une recherche complète sur CartPole a révélé CartPole-v0 et CartPole-v1. Hmmm? Dans acrobot, uniquement Acrobot-v1. J'ai essayé d'exécuter CartPole-v0 au lieu de CartPole-v1 avec le CartPole que j'ai créé plus tôt. Il semble que le niveau de difficulté augmente.

Je l'ai remplacé tel quel, mais quelque chose était différent. .. .. .. Acrobot est un mouvement pendulaire, et vous pouvez obtenir une récompense pour le succès en l'amenant à une certaine hauteur. Définissons-le de sorte que la valeur à l'avenir ne soit pas beaucoup actualisée. J'ai mis gamma à 0,99 et cela semble fonctionner.

J'utilise DQN (Deep Q Network). Il y a de nombreuses explications, c'est donc une bonne idée de google.

Recommended Posts

Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.

Renforcer l'apprentissage 13 Essayez Mountain_car avec ChainerRL.

Renforcer l'apprentissage 28 collaboratif + OpenAI + chainerRL

Renforcer l'apprentissage 3 Installation d'OpenAI

[Mac] J'ai essayé de renforcer l'apprentissage avec Open AI Baselines

Renforcer l'apprentissage 18 Colaboratory + Acrobat + ChainerRL

Renforcer l'apprentissage 17 Colaboratory + CartPole + ChainerRL

Renforcer l'apprentissage 19 Colaboratory + Mountain_car + ChainerRL

Renforcement de l'apprentissage 2 Installation de chainerrl

Essayez d'exécuter CNN avec ChainerRL

Essayez le Deep Learning avec FPGA

Apprentissage par renforcement 5 Essayez de programmer CartPole?

Apprentissage par renforcement 9 Remodelage magique ChainerRL

Essayez le machine learning à la légère avec Kaggle

Apprentissage par renforcement dans les plus brefs délais avec Keras avec OpenAI Gym

Renforcer l'apprentissage 21 Colaboratoire + Pendule + ChainerRL + A2C

Essayez l'apprentissage en profondeur avec TensorFlow Partie 2

Renforcer l'apprentissage 22 Colaboratory + CartPole + ChainerRL + A3C

Explorez le labyrinthe avec l'apprentissage augmenté

SVM essayant l'apprentissage automatique avec scikit-learn

Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer

Renforcer l'apprentissage 24 Colaboratory + CartPole + ChainerRL + ACER

Essayez l'apprentissage de la représentation commune avec le chainer

J'ai essayé l'apprentissage par renforcement profond (Double DQN) avec ChainerRL

[Renforcer l'apprentissage] DQN avec votre propre bibliothèque

Essayez les prévisions de prix Bitcoin avec Deep Learning

Essayez avec Chainer Deep Q Learning - Lancement

Essayez l'apprentissage profond de la génomique avec Kipoi

Renforcer l'apprentissage 14 Pendulum a été réalisé à ChainerRL.

[Python] Essayez facilement l'apprentissage amélioré (DQN) avec Keras-RL

[Introduction] Renforcer l'apprentissage

Apprentissage par renforcement 10 Essayez d'utiliser un réseau neuronal formé.

Renforcer l'apprentissage 12 Guide de démarrage rapide de ChainerRL Version Windows

Apprentissage par renforcement futur_2

Apprentissage par renforcement futur_1

Apprentissage par renforcement 27 chainerRL (+ chokozainerRL)

Défier la rupture avec le modèle Actor-Critic renforçant l'apprentissage

Je veux escalader une montagne avec l'apprentissage par renforcement

Apprentissage par renforcement 37 Démarrez automatiquement avec l'enrubanneuse Atari

Essayez de gratter avec Python.

Apprendre Python avec ChemTHEATER 03

"Orienté objet" appris avec python

Apprentissage amélioré 1 installation de Python

Apprendre Python avec ChemTHEATER 05-1

Renforcer l'apprentissage de la troisième ligne

Apprendre Python avec ChemTHEATER 02

Apprendre Python avec ChemTHEATER 01

Essayez SNN avec BindsNET

Apprentissage amélioré Python + Unity (apprentissage)

Essayez de faire une stratégie de blackjack en renforçant l'apprentissage (③ Renforcer l'apprentissage dans votre propre environnement OpenAI Gym))

Essayez la régression avec TensorFlow

[Apprentissage automatique] Démarrez Spark avec iPython Notebook et essayez MLlib

Essayez de créer un réseau de neurones / d'apprentissage en profondeur avec scratch

[Evangelion] Essayez de générer automatiquement des lignes de type Asuka avec Deep Learning

[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment

Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]

Apprentissage par renforcement 23 Créez et utilisez votre propre module avec Colaboratory