[PYTHON] Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.

Es wird davon ausgegangen, dass Sie bis zu 12 Bestärkungslernen erreicht haben. Ich werde es auf Ubuntu 18.04 tun. Ich habe versucht, CartPole-v0 durch MountainCar-v0 durch den zuvor erstellten CartPole zu ersetzen. Es scheint, dass der Schwierigkeitsgrad zunimmt.

Ich habe es so ersetzt, wie es war, aber etwas war anders. .. .. .. Ich habe Gamma auf 0,99 eingestellt.

Wenn man sich auf der Website umschaut, wird viel gelernt. Ist es der Trick, viel zu tun? Ich stelle es wie folgt ein.

chainerrl.experiments.train_agent_with_evaluation(
    agent, env,
    steps=1000000,           # Train the agent for 2000 steps
    eval_n_steps=None,       # 10 episodes are sampled for each evaluation
    eval_n_episodes=1,       # 10 episodes are sampled for each evaluation
    eval_max_episode_len=200,  # Maximum length of each episodes
    eval_interval=100,   # Evaluate the agent after every 1000 steps
    outdir='result')      # Save everything to 'result' directory
print('Finished.')

Ich setze epsilon = 0,003.

Es dauerte einige Lernzeit, aber ich konnte es klettern.

Klicken Sie hier für die Lernkurve 2000.

Hier ist die Kurve des 10000-fachen Lernens.

Wenn es 10.000 Mal ist, dauert es 85 Minuten. Ich wünschte, ich hätte einen Computer, den ich nicht benutzte. Was soll ich mit einem mobilen Computer machen, den ich normalerweise benutze?

Ich denke darüber nach, die GPU mit dem Ziel des 30. Males zu starten. Ich untersuche die Vorbereitung, aber Chainer hat eine extrem kleine Anzahl von Programmen. Über 8 MB auf der Festplatte. Der Tensorfluss ist groß und über 300 MB. Ich möchte Radeon als GPU verwenden, aber ich frage mich, ob Chainer funktioniert.

Recommended Posts

Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.

Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.

Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL

Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL

Versuchen Sie es mit TensorFlow

Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL

Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL

Stärkung des Lernens 2 Installation von Chainerrl

Verbessertes Lernen ab Python

Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL

Versuchen Sie, CNN mit ChainerRL auszuführen

Versuchen Sie Deep Learning mit FPGA

Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?

Verstärkungslernen 9 ChainerRL Magic Remodeling

Versuchen Sie es mit Kaggle leicht maschinell

Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C

Probieren Sie Deep Learning mit FPGA-Select-Gurken aus

Versuchen Sie es mit TensorFlow Part 2

Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C

Entdecken Sie das Labyrinth mit erweitertem Lernen

SVM versucht maschinelles Lernen mit Scikit-Learn

Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden

Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER

Versuchen Sie Common Representation Learning mit Chainer

Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert

[Stärkung des Lernens] DQN mit Ihrer eigenen Bibliothek

Probieren Sie die Bitcoin-Preisprognose mit Deep Learning aus

Versuchen Sie es mit Chainer Deep Q Learning - Launch

Versuchen Sie mit Kipoi tiefes Erlernen der Genomik

Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.

[Python] Probieren Sie mit Keras-RL ganz einfach erweitertes Lernen (DQN) aus

Probieren Sie den erweiterten Standard-Lernalgorithmus PPO von OpenAI aus

[Einführung] Stärkung des Lernens

Zukünftiges Verstärkungslernen_2

Zukünftiges Verstärkungslernen_1

Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.

Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version

Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)

Herausforderung Blockbruch mit Actor-Critic-Modell zur Stärkung des Lernens

[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken

Versuchen Sie es mit Python.

Python lernen mit ChemTHEATER 03

"Objektorientiert" mit Python gelernt

Erweitertes Lernen 1 Python-Installation

Python lernen mit ChemTHEATER 05-1

Stärkung des Lernens 3 OpenAI-Installation

Ich möchte mit verstärkendem Lernen einen Berg besteigen

Stärkung des Lernens der dritten Zeile

Versuchen Sie, den Wechselkurs (FX) mit nicht tiefem maschinellem Lernen vorherzusagen

Python lernen mit ChemTHEATER 02

Verstärkungslernen 37 Starten Sie automatisch mit Ataris Wrapper

[Lernen stärken] Banditenaufgabe

Python lernen mit ChemTHEATER 01

Versuchen Sie SNN mit BindsNET

Python + Unity Enhanced Learning (Lernen)

Versuchen Sie eine Regression mit TensorFlow

Stärkung des Lernens 1 Einführungsausgabe

Versuchen wir nun die Gesichtserkennung mit Chainer (Lernphase)