[PYTHON] Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?

Es wird davon ausgegangen, dass bis zur Stärkung des Lernens 4 abgeschlossen wurde.

Lassen Sie uns eine einfache Programmierung durchführen.

`CartPole2.py`


import gym
env = gym.make('CartPole-v0')
for i in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        action = 0
        if observation[2]>0:
            action = 1
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode{} finished after {} timesteps".format(i, t+1))
            break
env.close()

CartPole.py bewegte sich zufällig. Der Unterschied zu CartPole.py besteht darin, dass Sie die Aktion aufgrund des Unterschieds in der Beobachtung ändern möchten. Es wird zur Rückkopplungskontrolle.

Recommended Posts

Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?

Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL

Stärkung des Lernens 4 CartPole erster Schritt

Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.

Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C

Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden

Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER

Verstärkungslernen 3 Dynamische Planungsmethode / TD-Methode

[Einführung] Stärkung des Lernens

Zukünftiges Verstärkungslernen_2

Zukünftiges Verstärkungslernen_1

Probieren Sie den erweiterten Standard-Lernalgorithmus PPO von OpenAI aus

Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.

Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.

Erweitertes Lernen 1 Python-Installation

Stärkung des Lernens 3 OpenAI-Installation

Stärkung des Lernens der dritten Zeile

[Lernen stärken] Banditenaufgabe

Python + Unity Enhanced Learning (Lernen)

Stärkung des Lernens 1 Einführungsausgabe

Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL

Versuchen Sie es mit TensorFlow

Verbessertes Lernen 7 Protokollieren Sie die Ausgabe von Lerndaten

Deep Learning Gaiden ~ GPU-Programmierung ~

Versuchen Sie es mit normaler Linux-Programmierung Teil 7

Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL

Versuchen Sie, mit einer Shell zu programmieren!

Versuchen Sie die GUI-Programmierung mit Hy

Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL

Stärkung des Lernens 2 Installation von Chainerrl

[Lernen stärken] Tracking durch Multi-Agent

Stärkung des Lernens 6 First Chainer RL

Versuchen Sie es mit normaler Linux-Programmierung Teil 2

Verbessertes Lernen ab Python

Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL

Versuchen Sie Deep Learning mit FPGA

Verstärkungslernen 9 ChainerRL Magic Remodeling

Lernen stärken Lernen Sie von heute

Versuchen Sie es mit normaler Linux-Programmierung Teil 4

Python Machine Learning Programming> Schlüsselwörter

Versuchen Sie es mit normaler Linux-Programmierung Teil 6

[Einführung in die Stärkung des Lernens] Stärkung des Lernens, um sich vorerst zu bewegen

Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens

Erster Monat des Programmierlernens

Versuchen Sie Q-Lernen in einem Kampf im Drakue-Stil [Einführung in die Stärkung des Lernens]

Versuchen Sie es mit Kaggle leicht maschinell

Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung

DeepMind Enhanced Learning Framework Acme

Verstärktes Lernen: Beschleunigen Sie die Wertiteration

Versuchen Sie, eine Blackjack-Strategie zu entwickeln, indem Sie das Lernen stärken ((1) Implementierung von Blackjack)

Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C

Probieren Sie Deep Learning mit FPGA-Select-Gurken aus

TF2RL: Erweiterte Lernbibliothek für TensorFlow2.x

Python + Unity Verbesserte Erstellung von Lernumgebungen

Versuchen Sie es mit TensorFlow Part 2

Anfänger des maschinellen Lernens versuchen eine lineare Regression

Entdecken Sie das Labyrinth mit erweitertem Lernen

SVM versucht maschinelles Lernen mit Scikit-Learn

[Maschinelles Lernen] Versuchen Sie, zufällige Wälder zu studieren

Deep Strengthing Learning 3 Praktische Ausgabe: Block Breaking