[PYTHON] Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?

Es wird davon ausgegangen, dass bis zur Stärkung des Lernens 4 abgeschlossen wurde.

Lassen Sie uns eine einfache Programmierung durchführen.

CartPole2.py


import gym
env = gym.make('CartPole-v0')
for i in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        action = 0
        if observation[2]>0:
            action = 1
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode{} finished after {} timesteps".format(i, t+1))
            break
env.close()

CartPole.py bewegte sich zufällig. Der Unterschied zu CartPole.py besteht darin, dass Sie die Aktion aufgrund des Unterschieds in der Beobachtung ändern möchten. Es wird zur Rückkopplungskontrolle.

Recommended Posts

Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?
Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL
Stärkung des Lernens 4 CartPole erster Schritt
Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C
Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden
Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER
Verstärkungslernen 3 Dynamische Planungsmethode / TD-Methode
[Einführung] Stärkung des Lernens
Zukünftiges Verstärkungslernen_2
Zukünftiges Verstärkungslernen_1
Probieren Sie den erweiterten Standard-Lernalgorithmus PPO von OpenAI aus
Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.
Erweitertes Lernen 1 Python-Installation
Stärkung des Lernens 3 OpenAI-Installation
Stärkung des Lernens der dritten Zeile
[Lernen stärken] Banditenaufgabe
Python + Unity Enhanced Learning (Lernen)
Stärkung des Lernens 1 Einführungsausgabe
Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL
Versuchen Sie es mit TensorFlow
Verbessertes Lernen 7 Protokollieren Sie die Ausgabe von Lerndaten
Deep Learning Gaiden ~ GPU-Programmierung ~
Versuchen Sie es mit normaler Linux-Programmierung Teil 7
Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Versuchen Sie, mit einer Shell zu programmieren!
Versuchen Sie die GUI-Programmierung mit Hy
Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL
Stärkung des Lernens 2 Installation von Chainerrl
[Lernen stärken] Tracking durch Multi-Agent
Stärkung des Lernens 6 First Chainer RL
Versuchen Sie es mit normaler Linux-Programmierung Teil 2
Verbessertes Lernen ab Python
Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL
Versuchen Sie Deep Learning mit FPGA
Verstärkungslernen 9 ChainerRL Magic Remodeling
Lernen stärken Lernen Sie von heute
Versuchen Sie es mit normaler Linux-Programmierung Teil 4
Python Machine Learning Programming> Schlüsselwörter
Versuchen Sie es mit normaler Linux-Programmierung Teil 6
[Einführung in die Stärkung des Lernens] Stärkung des Lernens, um sich vorerst zu bewegen
Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens
Erster Monat des Programmierlernens
Versuchen Sie Q-Lernen in einem Kampf im Drakue-Stil [Einführung in die Stärkung des Lernens]
Versuchen Sie es mit Kaggle leicht maschinell
Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung
DeepMind Enhanced Learning Framework Acme
Verstärktes Lernen: Beschleunigen Sie die Wertiteration
Versuchen Sie, eine Blackjack-Strategie zu entwickeln, indem Sie das Lernen stärken ((1) Implementierung von Blackjack)
Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C
Probieren Sie Deep Learning mit FPGA-Select-Gurken aus
TF2RL: Erweiterte Lernbibliothek für TensorFlow2.x
Python + Unity Verbesserte Erstellung von Lernumgebungen
Versuchen Sie es mit TensorFlow Part 2
Anfänger des maschinellen Lernens versuchen eine lineare Regression
Entdecken Sie das Labyrinth mit erweitertem Lernen
SVM versucht maschinelles Lernen mit Scikit-Learn
[Maschinelles Lernen] Versuchen Sie, zufällige Wälder zu studieren
Deep Strengthing Learning 3 Praktische Ausgabe: Block Breaking