[PYTHON] Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL

(Der Chokozainer RL wurde am 8. Dezember 2019 aktualisiert.)

Es ist für KI-Anfänger gedacht, von Schülern der Mittelstufe bis zu Studenten der Universität. Ich habe bis zu 27 Verstärkungslernserien geschrieben. Es war ungefähr ein Monat, weil es ein Tempo pro Tag war. Ich werde eine Zusammenfassung schreiben, die es einfacher macht, von hier aus zu beginnen. Es gibt nichts Neues.

Wenn Sie das maschinelle Lernen mit der GPU einfach starten möchten, ist das Labor kostenlos. Ich empfehle es daher. Keine mühsame Installation erforderlich. Dies allein funktioniert jedoch nicht. Fassen wir das Verfahren zusammen. Ich habe chainerRL als Framework gewählt. Ich mag Tensorflow, aber ich habe es nicht benutzt, also ... Ich denke, ich werde bald versuchen, Tensorflow zu verwenden. Ich werde es in der Mitte schreiben, aber schauen wir uns den Quellcode so gut wie möglich an. Es wird auf Github veröffentlicht. Der Funktionsname ist leicht zu verstehen, daher denke ich, dass er leicht zu verstehen ist. Der Chainer ist auf Englisch leicht zu lesen, wahrscheinlich weil er von Japanern hergestellt wird. Oder besser gesagt, wenn Sie es mit Chrom ins Japanische übersetzen, ist es richtiges Japanisch. Was ist mit Tensorflow? ?? ?? ist. Wir haben chokozainerRL veröffentlicht, einen Wrapper für chainerRL. Ich habe nicht viel getan, aber ich hoffe, dass es für das "menschliche Lernen" beim verstärkten Lernen nützlich sein wird.

1 Holen Sie sich ein Google-Konto

Bitte erstellen Sie von hier aus.

Erstellen Sie ein Google-Konto https://support.google.com/accounts/answer/27441?hl=ja

2 Öffnen Sie die Seite "Labor"

Von hier aus öffnen. https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja Lassen Sie es uns als Lesezeichen speichern.

3 Öffnen Sie die Chokozainer-Beispielseite und speichern Sie sie in Ihrem eigenen Ordner

3-1 Öffnen Sie das Notebook

open_toolbar.png

Notebook öffnen select_abc.png

Wählen Sie die Registerkarte GitHub. Suche mit Chokozainer, ipynbs/abc.ipynb Wählen.

Das geöffnete abc.ipynb kann nicht so verwendet werden, wie es ist. Erstellen Sie daher eine Kopie auf dem Laufwerk. select_save.png

Benennen Sie dann die kopierte Datei um. change.png

4 Führen Sie das Notebook aus.

Das Ausführen eines Notebooks wird auf verschiedenen Websites ausführlich erläutert. Machen Sie es also bitte selbst. Vor dem Lernen konnten Sie nur wenige Schritte ausführen. Nach dem Lernen können Sie jedoch feststellen, dass Sie bis zu 200 Einstellungsschritte ausgleichen können. Sie können ein Video wie dieses erstellen. videoimage.png

Das Ergebnis der Lernausführung sieht folgendermaßen aus. result.png

Da die Ausführungszeit (Sekunden) abgelaufen ist, ist das Lernen in etwa 15 Minuten abgeschlossen.

Recommended Posts

Stärkung des Lernens 28 colaboratory + OpenAI + chainerRL
Stärkung des Lernens 18 Colaboratory + Acrobat + ChainerRL
Stärkung des Lernens 17 Colaboratory + CartPole + ChainerRL
Stärkung des Lernens 19 Colaboratory + Mountain_car + ChainerRL
Stärkung des Lernens 20 Colaboratory + Pendulum + ChainerRL
Stärkung des Lernens 21 Labor + Pendel + ChainerRL + A2C
Stärkung des Lernens 22 Colaboratory + CartPole + ChainerRL + A3C
Stärkung des Lernens 24 Colaboratory + CartPole + ChainerRL + ACER
Stärkung des Lernens 11 Probieren Sie OpenAI Acrobot mit ChainerRL aus.
Verstärkungslernen 27 kollaborative 90-Minuten-Regel misst chainerRL (+ chokozainerRL)
Stärkung des Lernens 2 Installation von Chainerrl
Verstärkungslernen 9 ChainerRL Magic Remodeling
Lernen stärken 13 Probieren Sie Mountain_car mit ChainerRL aus.
[Einführung] Stärkung des Lernens
Zukünftiges Verstärkungslernen_2
Zukünftiges Verstärkungslernen_1
Stärkung des Lernens 14 Pendel wurde bei ChainerRL durchgeführt.
Stärkung des Lernens 12 ChainerRL-Kurzanleitung Windows-Version
[Mac] Ich habe versucht, das Lernen mit Open AI Baselines zu stärken
Stärkung des Lernens der dritten Zeile
[Lernen stärken] Banditenaufgabe
Python + Unity Enhanced Learning (Lernen)
Stärkung des Lernens 1 Einführungsausgabe
Verbessertes Lernen 7 Protokollieren Sie die Ausgabe von Lerndaten
Verstärkungslernen in kürzester Zeit mit Keras mit OpenAI Gym
[Lernen stärken] Tracking durch Multi-Agent
Stärkung des Lernens 6 First Chainer RL
Verbessertes Lernen ab Python
Verstärkungslernen 5 Versuchen Sie, CartPole zu programmieren?
Lernen stärken Lernen Sie von heute
Stärkung des Lernens 4 CartPole erster Schritt
Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens
Reinforcement Learning 23 Erstellen und verwenden Sie Ihr eigenes Modul mit Colaboratory
Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung
DeepMind Enhanced Learning Framework Acme
Verstärktes Lernen: Beschleunigen Sie die Wertiteration
Ich habe mit ChainerRL Deep Enforcement Learning (Double DQN) ausprobiert
[Lernen stärken] Wie zeichnet man OpenAI Gym auf Google Corab (Version 2020.6)?
TF2RL: Erweiterte Lernbibliothek für TensorFlow2.x
Verstärkungslernen 34 Erstellen Sie fortlaufende Agentenvideos
Python + Unity Verbesserte Erstellung von Lernumgebungen
Entdecken Sie das Labyrinth mit erweitertem Lernen
Stärkung des Lernens 8 Versuchen Sie, die Chainer-Benutzeroberfläche zu verwenden
Verstärkungslernen 3 Dynamische Planungsmethode / TD-Methode
Deep Strengthing Learning 3 Praktische Ausgabe: Block Breaking
Ich habe versucht, mit PyBrain verstärkt zu lernen
Lerne beim Machen! Tiefes Verstärkungslernen_1