[PYTHON] Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.

Es wird davon ausgegangen, dass Sie bis zu 12 Bestärkungslernen erreicht haben. Ich werde es auf Ubuntu 18.04 tun. Ich habe versucht, CartPole-v0 durch MountainCar-v0 durch den zuvor erstellten CartPole zu ersetzen. Es scheint, dass der Schwierigkeitsgrad zunimmt.

Ich habe es so ersetzt, wie es war, aber etwas war anders. .. .. .. Ich habe Gamma auf 0,99 eingestellt.

Wenn man sich auf der Website umschaut, wird viel gelernt. Ist es der Trick, viel zu tun? Ich stelle es wie folgt ein.

chainerrl.experiments.train_agent_with_evaluation(
    agent, env,
    steps=1000000,           # Train the agent for 2000 steps
    eval_n_steps=None,       # 10 episodes are sampled for each evaluation
    eval_n_episodes=1,       # 10 episodes are sampled for each evaluation
    eval_max_episode_len=200,  # Maximum length of each episodes
    eval_interval=100,   # Evaluate the agent after every 1000 steps
    outdir='result')      # Save everything to 'result' directory
print('Finished.')

Ich setze epsilon = 0,003.

Es dauerte einige Lernzeit, aber ich konnte es klettern.

Klicken Sie hier für die Lernkurve 2000. mountaincar_20191118124725.png

Hier ist die Kurve des 10000-fachen Lernens. mountaincar_20191119123112.png

Wenn es 10.000 Mal ist, dauert es 85 Minuten. Ich wünschte, ich hätte einen Computer, den ich nicht benutzte. Was soll ich mit einem mobilen Computer machen, den ich normalerweise benutze?

Ich denke darüber nach, die GPU mit dem Ziel des 30. Males zu starten. Ich untersuche die Vorbereitung, aber Chainer hat eine extrem kleine Anzahl von Programmen. Über 8 MB auf der Festplatte. Der Tensorfluss ist groß und über 300 MB. Ich möchte Radeon als GPU verwenden, aber ich frage mich, ob Chainer funktioniert.

Recommended Posts

Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL
Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL
Versuchen Sie es mit TensorFlow
Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL
Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Stärkung des Lernens 2 Installation von Chainerrl
Verbessertes Lernen ab Python
Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL
Versuchen Sie, CNN mit ChainerRL auszuführen
Versuchen Sie Deep Learning mit FPGA
Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?
Verstärkungslernen 9 ChainerRL Magic Remodeling
Versuchen Sie es mit Kaggle leicht maschinell
Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C
Probieren Sie Deep Learning mit FPGA-Select-Gurken aus
Versuchen Sie es mit TensorFlow Part 2
Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C
Entdecken Sie das Labyrinth mit erweitertem Lernen
SVM versucht maschinelles Lernen mit Scikit-Learn
Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden
Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER
Versuchen Sie Common Representation Learning mit Chainer
Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert
[Stärkung des Lernens] DQN mit Ihrer eigenen Bibliothek
Probieren Sie die Bitcoin-Preisprognose mit Deep Learning aus
Versuchen Sie es mit Chainer Deep Q Learning - Launch
Versuchen Sie mit Kipoi tiefes Erlernen der Genomik
Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.
[Python] Probieren Sie mit Keras-RL ganz einfach erweitertes Lernen (DQN) aus
Probieren Sie den erweiterten Standard-Lernalgorithmus PPO von OpenAI aus
[Einführung] Stärkung des Lernens
Zukünftiges Verstärkungslernen_2
Zukünftiges Verstärkungslernen_1
Verstärkungslernen 10 Versuchen Sie es mit einem trainierten neuronalen Netz.
Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version
Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)
Herausforderung Blockbruch mit Actor-Critic-Modell zur Stärkung des Lernens
[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken
Versuchen Sie es mit Python.
Python lernen mit ChemTHEATER 03
"Objektorientiert" mit Python gelernt
Erweitertes Lernen 1 Python-Installation
Python lernen mit ChemTHEATER 05-1
Stärkung des Lernens 3 OpenAI-Installation
Ich möchte mit verstärkendem Lernen einen Berg besteigen
Stärkung des Lernens der dritten Zeile
Versuchen Sie, den Wechselkurs (FX) mit nicht tiefem maschinellem Lernen vorherzusagen
Python lernen mit ChemTHEATER 02
Verstärkungslernen 37 Starten Sie automatisch mit Ataris Wrapper
[Lernen stärken] Banditenaufgabe
Python lernen mit ChemTHEATER 01
Versuchen Sie SNN mit BindsNET
Python + Unity Enhanced Learning (Lernen)
Versuchen Sie eine Regression mit TensorFlow
Stärkung des Lernens 1 Einführungsausgabe
Versuchen wir nun die Gesichtserkennung mit Chainer (Lernphase)