[PYTHON] Apprentissage par renforcement 5 Essayez de programmer CartPole?

On suppose que jusqu'au renforcement de l'apprentissage 4 a été achevé.

Faisons une programmation simple.

`CartPole2.py`


import gym
env = gym.make('CartPole-v0')
for i in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        action = 0
        if observation[2]>0:
            action = 1
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode{} finished after {} timesteps".format(i, t+1))
            break
env.close()

CartPole.py se déplaçait au hasard. La différence avec CartPole.py est que vous souhaitez modifier l'action en raison de la différence d'observation. Cela devient un contrôle de rétroaction.

Recommended Posts

Apprentissage par renforcement 5 Essayez de programmer CartPole?

Renforcer l'apprentissage 17 Colaboratory + CartPole + ChainerRL

Renforcer l'apprentissage 4 CartPole première étape

Renforcer l'apprentissage 13 Essayez Mountain_car avec ChainerRL.

Renforcer l'apprentissage 22 Colaboratory + CartPole + ChainerRL + A3C

Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer

Renforcer l'apprentissage 24 Colaboratory + CartPole + ChainerRL + ACER

Apprentissage par renforcement 3 Méthode de planification dynamique / méthode TD

[Introduction] Renforcer l'apprentissage

Apprentissage par renforcement futur_2

Apprentissage par renforcement futur_1

Essayez l'algorithme d'apprentissage amélioré standard d'OpenAI PPO

Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.

Apprentissage par renforcement 10 Essayez d'utiliser un réseau neuronal formé.

Apprentissage amélioré 1 installation de Python

Renforcer l'apprentissage 3 Installation d'OpenAI

Renforcer l'apprentissage de la troisième ligne

[Renforcer l'apprentissage] Tâche de bandit

Apprentissage amélioré Python + Unity (apprentissage)

Renforcer l'apprentissage 1 édition introductive

Renforcer l'apprentissage 18 Colaboratory + Acrobat + ChainerRL

Essayez l'apprentissage en profondeur avec TensorFlow

Apprentissage amélioré 7 Sortie du journal des données d'apprentissage

Deep Learning Gaiden ~ Programmation GPU ~

Essayez la programmation Linux normale, partie 7

Renforcer l'apprentissage 28 collaboratif + OpenAI + chainerRL

Essayez de programmer avec un shell!

Essayez la programmation GUI avec Hy

Renforcer l'apprentissage 19 Colaboratory + Mountain_car + ChainerRL

Renforcement de l'apprentissage 2 Installation de chainerrl

[Renforcer l'apprentissage] Suivi par multi-agents

Renforcer l'apprentissage 6 First Chainer RL

Essayez la programmation Linux normale, partie 2

Apprentissage amélioré à partir de Python

Renforcer l'apprentissage 20 Colaboratoire + Pendule + ChainerRL

Essayez le Deep Learning avec FPGA

Apprentissage par renforcement 9 Remodelage magique ChainerRL

Renforcer l'apprentissage Apprendre d'aujourd'hui

Essayez la programmation Linux normale, partie 4

Programmation Python Machine Learning> Mots-clés

Essayez la programmation Linux normale, partie 6

[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment

Apprentissage par renforcement profond 1 Introduction au renforcement de l'apprentissage

Premier mois d'apprentissage en programmation

Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]

Essayez le machine learning à la légère avec Kaggle

Apprentissage par renforcement profond 2 Mise en œuvre de l'apprentissage par renforcement

DeepMind Enhanced Learning Framework Acme

Apprentissage par renforcement: accélérer l'itération de la valeur

Essayez de faire une stratégie de blackjack en renforçant l'apprentissage ((1) Implémentation du blackjack)

Renforcer l'apprentissage 21 Colaboratoire + Pendule + ChainerRL + A2C

Essayez le Deep Learning avec les concombres FPGA-Select

TF2RL: bibliothèque d'apprentissage améliorée pour TensorFlow2.x

Construction d'un environnement d'apprentissage amélioré Python + Unity

Essayez l'apprentissage en profondeur avec TensorFlow Partie 2

Les débutants en apprentissage automatique essaient la régression linéaire

Explorez le labyrinthe avec l'apprentissage augmenté

SVM essayant l'apprentissage automatique avec scikit-learn

[Apprentissage automatique] Essayez d'étudier une forêt aléatoire

Deep Strengthening Learning 3 Édition pratique: Briser des blocs