[PYTHON] [Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken

Ich habe versucht, die von OpenAI am 24. Mai 2017 angekündigte Open Source für erweitertes Lernen zu verwenden, da sie anscheinend einfach zu verwenden ist: smiley: "DQN" und seine drei Varianten verbesserter Lernalgorithmen, die von der Forschungsgruppe für künstliche Intelligenz "OpenAI" veröffentlicht wurden Baselines github

Die folgenden beiden werden als auszuführende Tutorials vorgestellt baselines.deepq.experiments.train_cartpole baselines.deepq.experiments.train_pong

Umgebung

Mac OS Sierra 10.12.4 python 3.6.1 Beachten Sie übrigens, dass dies mit der Python2.7-Serie nicht möglich ist.

cartpole Dieses Tutorial scheint ein Spiel zu sein, um zu verhindern, dass der Stock des Wagens herunterfällt Führen Sie vorerst ohne nachzudenken aus

Es wird gesagt, dass es nicht genügend Module gibt, also installieren Sie es hart

#Befehle zum Lernen
python -m baselines.deepq.experiments.train_cartpole

#Befehl, mit dem Modell des Lernergebnisses zu spielen
python -m baselines.deepq.experiments.enjoy_cartpole

Lassen Sie uns das Lernen stärken ... Die Folgen hörten übrigens bei 690 auf. image.png

Ich habe versucht zu spielen

Wie spielst du das ...: Denken: Wenn festgestellt wird, dass das schwarze Objekt gefallen ist, fühlt es sich an, als wäre es neu geladen worden, aber es macht keinen Sinn. image.png

pong Dies scheint ein Pflichtspiel wie Eishockey zu sein

Auch hier sind die fehlenden Module installiert Übrigens, wenn Ihnen gesagt wird, dass es kein "cv2" gibt, bedeutet dies OpenCV, daher sollten Sie sich auf Folgendes beziehen. OpenCV3 von Python3 verfügbar machen, das mit pyenv installiert wurde

Wie Sie dem folgenden Artikel entnehmen können, sind die Einstellungen für das Öffnen von CVV unter Linux recht problematisch. Der einfachste Weg, OpenCV mit Python zu verwenden Also wechselte ich zu Anaconda und ließ es laufen. (Empfohlen, da dies bald möglich ist)

#Befehle zum Lernen
python -m baselines.deepq.experiments.train_pong

#Befehle zum Spielen mit dem Trainingsergebnismodell
python -m baselines.deepq.experiments.enjoy_pong

Ich lerne ... image.png

Wenn eine Episode 90 Sekunden dauert und 690 Mal wiederholt wird, dauert es ungefähr 62.100 Sekunden, 17 Stunden und 15 Minuten ...

~~ Ich habe auf halbem Weg angehalten ~~

Ich habe versucht: unschuldig:

Es gab ungefähr 1160 Folgen, also hat es lange gedauert ... Ich kann nichts sagen, weil es unterwegs im Schlafmodus angehalten hat, aber ich glaube, es hat ungefähr 8 Stunden gedauert. Screenshot from 2017-05-28 21-43-00.png

Bitte überprüfen Sie das Video unten für die Ergebnisse des Spielens. [Versuchen Sie OpenAI Baselines unter Windows (Winpython). ]] (http://qiita.com/tmizu23/items/ff1d5c89bc99292410c0)

(Übrigens habe ich mich gefragt, ob dies ein Kampf zwischen Menschen und maschinellem Lernen sein könnte, aber das ist nicht der Fall ... Ich wollte das verstärkte Lernen bekämpfen ...)

Recommended Posts

[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken
Ich habe maschinelles Lernen mit liblinear versucht
Ich habe versucht, mit PyBrain verstärkt zu lernen
Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert
Stärkung des Lernens 3 OpenAI-Installation
Ich habe versucht, tief zu lernen
Ich habe versucht, maschinelles Lernen (Objekterkennung) mit TouchDesigner zu verschieben
Mayungos Python-Lernfolge 1: Ich habe versucht, mit Druck zu drucken
Ich habe fp-Wachstum mit Python versucht
Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Ich habe versucht, mit Elasticsearch Ranking zu lernen!
Ich habe versucht, mit PyCaret zu clustern
Verbessertes Lernen ab Python
Ich habe gRPC mit Python ausprobiert
Ich habe versucht, mit Python zu kratzen
Ich habe versucht, mit Open AI Gym eine verbesserte Lernumgebung für Othello zu schaffen
Ich habe versucht, mit Python (Mac OS X) eine Umgebung für maschinelles Lernen zu erstellen.
Verstärkungslernen in kürzester Zeit mit Keras mit OpenAI Gym
Mayungos Python Learning Episode 3: Ich habe versucht, Zahlen zu drucken
Ich habe versucht, in einem tief erlernten Sprachmodell zu schreiben
Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
Ich habe versucht, Sätze mit summpy zusammenzufassen
Ich habe versucht, WebScraping mit Python.
Ich habe versucht, Essen mit SinGAN zu bewegen
Ich habe versucht, das Gesicht mit MTCNN zu erkennen
Ich habe versucht, mit Theano tief zu lernen
Ich habe versucht, Prolog mit Python 3.8.2 auszuführen.
Ich habe die SMTP-Kommunikation mit Python versucht
Ich habe versucht, Sätze mit GPT-2 zu generieren
Ich habe versucht, das Gesicht mit OpenCV zu erkennen
Ich habe versucht, Deep Learning mit Spark × Keras × Docker skalierbar zu machen
Ich las "Das Lernen mit Python von der Einführung bis zur Praxis stärken", Kapitel 1
Ich las "Das Lernen mit Python von der Einführung bis zur Praxis stärken", Kapitel 2
Mayungos Python Learning Episode 7: Ich habe versucht, mit if, elif, else zu drucken
DQN mit Chainer. Ich habe verschiedene Verstärkungslernen hintereinander ausprobiert. (Deep Q Network, Q-Lernen, Monte Carlo)
Ich habe eine multiple Regressionsanalyse mit Polypoly-Regression versucht
Ich habe versucht, eine SMS mit Twilio zu senden
Ich habe versucht, Amazon SQS mit Django-Sellerie zu verwenden
[Stärkung des Lernens] DQN mit Ihrer eigenen Bibliothek
Ich habe versucht, Deep Learning zu implementieren, das nicht nur mit NumPy tiefgreifend ist
Ich habe versucht, Autoencoder mit TensorFlow zu implementieren
Ich habe Linebot mit Flasche (Anaconda) + Heroku ausprobiert
[Lernen stärken] Ich habe R2D3 (Keras-RL) implementiert / erklärt.
Ich habe versucht, AutoEncoder mit TensorFlow zu visualisieren
Ich habe versucht, mit Hy anzufangen
Ich habe versucht, Selen mit Headless-Chrom zu verwenden
[Kaggle] Ich habe versucht, Ensemble mit LightGBM zu lernen
Ich habe versucht, mit Python + opencv nicht realistisch zu rendern
Mayungos Python Learning Episode 2: Ich habe versucht, Zeichen mit Variablen zu löschen
[Stärkung des Lernens] Endlich die Menschen übertroffen! ?? Ich habe versucht, Agent57 (Keras-RL) zu erklären / zu implementieren.
Ich habe eine funktionale Sprache mit Python ausprobiert
Ich habe versucht, mit Python ② (Fibonacci-Zahlenfolge) aufzuklären.
Ich habe versucht, DeepPose mit PyTorch PartⅡ zu implementieren
Ich habe versucht, CVAE mit PyTorch zu implementieren
Ich habe versucht, mit Pillow mit dem Bild zu spielen
Mayungos Python Learning Episode 8: Ich habe versucht, Eingaben zu machen