[PYTHON] Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung

Aidemy 2020/11/22

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur KI-Fachschule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der zweite Beitrag von Deep Strengthing Learning. Freut mich, dich kennenzulernen.

Was diesmal zu lernen ・ Implementierung von verbessertem Lernen

Implementierung von verbessertem Lernen

Schaffung einer Umgebung

-In dem Kapitel "Stärkung des Lernens" wurde die Umgebung usw. von mir selbst definiert, aber dieses Mal werden wir die Umgebung usw. mithilfe der Bibliothek erstellen, die verschiedene Umgebungen zur Stärkung des Lernens vorbereitet. -Die zu verwendende Bibliothek ist __ "keras-rl" __, die aus Keras und __OpenAIGym (Gym) __ besteht. Dieses Mal werden wir dies verwenden, um __Cartpole Demo __ mit DQN zu lernen.

・ Erstellen Sie zunächst environment. Die Methode ist nur __ "env = gym.make ()" __. Geben Sie den Umgebungstyp im Argument an. Die Umgebung der Wagenstange wird als __ "" CartPole-v0 "" __ angegeben. Danach kann es durch Zugriff auf die env-Instanz betrieben werden. -In dieser Wagenstange gibt es zwei Aktionen: __ "Wagen nach rechts bewegen" und "Wagen nach links bewegen" __ und um diese __ "env.action_space.n" zu erhalten Sie können __ verwenden.

・ Code![Screenshot 2020-11-19 10.31.55.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/d10ad3fb-5063-56c5- aaf1-453352008e27.png)

Ein Modell bauen

・ Code![Screenshot 2020-11-19 10.32.22.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/a8af8cb2-4c1f-3956- 62f8-26e9086e06ff.png)

Agenteneinstellungen 1 Verlauf und Kennzahlen

-Hier wird die __agent-Einstellung __ ausgeführt, die den Hauptteil des erweiterten Lernens darstellt. Stellen Sie zunächst die für diese Einstellung erforderliche __history __ und policy __ ein. (Geschichte ist "Geschichte dessen, was Sie in der Vergangenheit getan haben") - Verlauf __ kann mit __ "Sequentieller Speicher (Limit, Fensterlänge)" __ eingestellt werden. limit ist die Anzahl der zu speichernden Speicher. -Für policy verwenden Sie __ "BoltzmannQPolicy ()" __, wenn Sie die Boltzmann-Richtlinie verwenden, und __ "EpsGreedyQPolicy ()" __, wenn Sie die ε-gierige Methode anwenden.

・ Code![Screenshot 2020-11-19 10.41.15.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/b834e4f7-d691-531d- e28c-98eda7808306.png)

Agenteneinstellungen 2

・ Code (verwenden Sie den im vorherigen Abschnitt für Modell usw.)![Screenshot 2020-11-19 11.12.57.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/ 0/698700 / ff94997e-3e16-3d04-961d-1f9fd389a025.png)

Test durchführen

Zusammenfassung

-Verwenden Sie keras-rl, wenn Sie mithilfe der Bibliothek erweitertes Lernen durchführen.

Diese Zeit ist vorbei. Vielen Dank, dass Sie so weit gelesen haben.

Recommended Posts

Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung
Othello-Aus der dritten Zeile von "Implementation Deep Learning" (3)
Deep Learning 1 Übung des Deep Learning
Othello-Aus der dritten Zeile von "Implementation Deep Learning" (2)
[Lernnotiz] Deep Learning von Grund auf ~ Implementierung von Dropout ~
Implementierung eines Deep Learning-Modells zur Bilderkennung
Tiefes Lernen durch Implementierung (Segmentierung) ~ Implementierung von SegNet ~
Stärkung des Lernens 2 Installation von Chainerrl
Deep Running 2 Tuning von Deep Learning
Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens
Othello ~ Aus der dritten Zeile von "Implementation Deep Learning" (4) [Ende]
Tiefes Lernen
Deep Learning durch Implementierung 1 gelernt (Return Edition)
Deep Strengthing Learning 3 Praktische Ausgabe: Block Breaking
Deep Learning Bilderkennung 2 Modellimplementierung
Lerne beim Machen! Tiefes Verstärkungslernen_1
[Deep Learning von Grund auf neu] Implementierung der Momentum-Methode und der AdaGrad-Methode
Deep Learning 2 durch Implementierung gelernt (Bildklassifizierung)
Verbessertes Lernen, um von null bis tief zu lernen
Bedeutung von Deep-Learning-Modellen und -Parametern
Qiskit: Implementierung von Quantum Circuit Learning (QCL)
Implementierung eines 3-Schicht-Neuronalen Netzwerks (kein Lernen)
<Kurs> Deep Learning Day4 Stärkung des Lernens / Tensorflusses
Deep Learning Memorandum
Starten Sie Deep Learning
Versuchen Sie mit Kipoi tiefes Erlernen der Genomik
Algorithmus für maschinelles Lernen (Implementierung einer Klassifizierung mit mehreren Klassen)
Visualisieren Sie die Auswirkungen von Deep Learning / Regularisierung
Zukünftiges Verstärkungslernen_2
Zukünftiges Verstärkungslernen_1
Emotionale Analyse von Tweets mit Deep Learning
Python Deep Learning
Versuchen Sie, eine Blackjack-Strategie zu entwickeln, indem Sie das Lernen stärken ((1) Implementierung von Blackjack)
Lernbericht über das Lesen von "Deep Learning von Grund auf neu"
Python vs Ruby "Deep Learning von Grund auf neu" Kapitel 4 Implementierung der Verlustfunktion
Die Geschichte des tiefen Lernens mit TPU
[Lernen stärken] Rache-Kommentar (Keras-RL), der versucht hat, R2D2 zu implementieren / zu erklären
Deep Learning / Fehler-Backpropagation der Sigmoid-Funktion
Ein Memorandum zum Studieren und Implementieren von Deep Learning
Tiefes Lernen durch Implementierung gelernt ~ Erkennung von Abnormalitäten (Lernen ohne Lehrer) ~
Grundlegendes Verständnis der Stereo-Tiefenschätzung (Deep Learning)
Paralleles Lernen von Deep Learning durch Keras und Kubernetes
Erstes tiefes Lernen in C # - Einführung in Python implementieren-
Erstes tiefes Lernen ~ Kampf ~
Python vs Ruby "Deep Learning von Grund auf neu" Kapitel 3 Implementierung eines dreischichtigen neuronalen Netzwerks
Erweitertes Lernen 1 Python-Installation
Stärkung des Lernens 3 OpenAI-Installation
Python: Deep Learning-Praxis
Deep Learning / Aktivierungsfunktionen
Deep Learning von Grund auf neu
Stärkung des Lernens der dritten Zeile
Deep Learning / Cross Entropy
Erstes tiefes Lernen ~ Vorbereitung ~
Deep Learning von Grund auf neu Die Theorie und Implementierung des mit Python erlernten Deep Learning Kapitel 3
Erstes tiefes Lernen ~ Lösung ~
[AI] Deep Metric Learning
Implementierung der Fibonacci-Sequenz
Ich habe versucht, tief zu lernen