[PYTHON] Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.

On suppose que vous avez réalisé jusqu'à 10 apprentissages par renforcement. Si vous google avec openai acrobot, Acrobot-v1 sortira. Je ne suis pas sûr de la v1 ou de la v0, je vais donc enquêter avant de le remodeler. userfolder/anaconda3/envs/chainer/lib/python3.7/site-packages/gym Avec VS Code. Une recherche complète sur CartPole a révélé CartPole-v0 et CartPole-v1. Hmmm? Dans acrobot, uniquement Acrobot-v1. J'ai essayé d'exécuter CartPole-v0 au lieu de CartPole-v1 avec le CartPole que j'ai créé plus tôt. Il semble que le niveau de difficulté augmente.

Je l'ai remplacé tel quel, mais quelque chose était différent. .. .. .. Acrobot est un mouvement pendulaire, et vous pouvez obtenir une récompense pour le succès en l'amenant à une certaine hauteur. Définissons-le de sorte que la valeur à l'avenir ne soit pas beaucoup actualisée. J'ai mis gamma à 0,99 et cela semble fonctionner.

J'utilise DQN (Deep Q Network). Il y a de nombreuses explications, c'est donc une bonne idée de google.

Recommended Posts

Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.
Renforcer l'apprentissage 13 Essayez Mountain_car avec ChainerRL.
Renforcer l'apprentissage 28 collaboratif + OpenAI + chainerRL
Renforcer l'apprentissage 3 Installation d'OpenAI
[Mac] J'ai essayé de renforcer l'apprentissage avec Open AI Baselines
Renforcer l'apprentissage 18 Colaboratory + Acrobat + ChainerRL
Renforcer l'apprentissage 17 Colaboratory + CartPole + ChainerRL
Renforcer l'apprentissage 19 Colaboratory + Mountain_car + ChainerRL
Renforcement de l'apprentissage 2 Installation de chainerrl
Essayez d'exécuter CNN avec ChainerRL
Essayez le Deep Learning avec FPGA
Apprentissage par renforcement 5 Essayez de programmer CartPole?
Apprentissage par renforcement 9 Remodelage magique ChainerRL
Essayez le machine learning à la légère avec Kaggle
Apprentissage par renforcement dans les plus brefs délais avec Keras avec OpenAI Gym
Renforcer l'apprentissage 21 Colaboratoire + Pendule + ChainerRL + A2C
Essayez l'apprentissage en profondeur avec TensorFlow Partie 2
Renforcer l'apprentissage 22 Colaboratory + CartPole + ChainerRL + A3C
Explorez le labyrinthe avec l'apprentissage augmenté
SVM essayant l'apprentissage automatique avec scikit-learn
Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer
Renforcer l'apprentissage 24 Colaboratory + CartPole + ChainerRL + ACER
Essayez l'apprentissage de la représentation commune avec le chainer
J'ai essayé l'apprentissage par renforcement profond (Double DQN) avec ChainerRL
[Renforcer l'apprentissage] DQN avec votre propre bibliothèque
Essayez les prévisions de prix Bitcoin avec Deep Learning
Essayez avec Chainer Deep Q Learning - Lancement
Essayez l'apprentissage profond de la génomique avec Kipoi
Renforcer l'apprentissage 14 Pendulum a été réalisé à ChainerRL.
[Python] Essayez facilement l'apprentissage amélioré (DQN) avec Keras-RL
[Introduction] Renforcer l'apprentissage
Apprentissage par renforcement 10 Essayez d'utiliser un réseau neuronal formé.
Renforcer l'apprentissage 12 Guide de démarrage rapide de ChainerRL Version Windows
Apprentissage par renforcement futur_2
Apprentissage par renforcement futur_1
Apprentissage par renforcement 27 chainerRL (+ chokozainerRL)
Défier la rupture avec le modèle Actor-Critic renforçant l'apprentissage
Je veux escalader une montagne avec l'apprentissage par renforcement
Apprentissage par renforcement 37 Démarrez automatiquement avec l'enrubanneuse Atari
Essayez de gratter avec Python.
Apprendre Python avec ChemTHEATER 03
"Orienté objet" appris avec python
Apprentissage amélioré 1 installation de Python
Apprendre Python avec ChemTHEATER 05-1
Renforcer l'apprentissage de la troisième ligne
Apprendre Python avec ChemTHEATER 02
Apprendre Python avec ChemTHEATER 01
Essayez SNN avec BindsNET
Apprentissage amélioré Python + Unity (apprentissage)
Essayez de faire une stratégie de blackjack en renforçant l'apprentissage (③ Renforcer l'apprentissage dans votre propre environnement OpenAI Gym))
Essayez la régression avec TensorFlow
[Apprentissage automatique] Démarrez Spark avec iPython Notebook et essayez MLlib
Essayez de créer un réseau de neurones / d'apprentissage en profondeur avec scratch
[Evangelion] Essayez de générer automatiquement des lignes de type Asuka avec Deep Learning
[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment
Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]
Apprentissage par renforcement 23 Créez et utilisez votre propre module avec Colaboratory