[PYTHON] Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens

Aidemy 2020/11/21

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur KI-Fachschule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der erste Beitrag zum vertieften Lernen. Freut mich, dich kennenzulernen.

Was diesmal zu lernen ・ (Rückblick) Stärkung des Lernens ・ Stärkung der Lernmethode ・ DQN

(Rückblick) Über die Stärkung des Lernens

Stärken des Lernens ist eine Methode des maschinellen Lernens. ・ Das Folgende sind die Komponenten des verbesserten Lernens. Das handelnde Subjekt agent, das Ziel der Aktion__Umgebung__, die Aktion auf die Umgebung__Verhalten__ und die Elemente der Umgebung, die sich entsprechend ändern, sind Zustand. Außerdem gibt Reward die Bewertung an, die durch die Aktion sofort erhalten wurde, und Profit gibt an, wie viel die Gesamtbelohnung letztendlich erhalten hat. ・ Der Zweck des verstärkten Lernens besteht darin, die Summe dieser Ergebnisse zu maximieren.

Lernmaßnahmen stärken

(Review) gierige Methode

-Es ist wichtig, Maßnahmen im Einklang mit dem Problem der Maßnahmen bezüglich der Durchführung der oben gezeigten Suche und Verwendung zu ergreifen.

Boltzmann Auswahl

・ Die ε-gierige Methode war eine __Methode zur Auswahl von Aktionen mit einer gewissen Wahrscheinlichkeit. Ähnlich gibt es eine Richtlinie namens __ "Boltzmann-Auswahl" __. -Boltzmann-Auswahl wird so genannt, weil die Auswahlwahrscheinlichkeit der folgenden __Boltzmann-Verteilung __ folgt.

スクリーンショット 2020-11-18 11.58.34.png

-In dieser Formel heißt __ "T" __ __Temperaturfunktion __, und es ist __ "Funktion, die im Laufe der Zeit gegen 0 konvergiert" __. Zu diesem Zeitpunkt wählt __T → unendliches Limit __ alle Aktionen mit der gleichen Wahrscheinlichkeit __ aus, und __T → 0 Limit __ erleichtert die Auswahl der Aktion mit dem maximal erwarteten Belohnungswert __ Es ist eine Sache.

DQN -__ DQN__ ist die __Q-Funktion des Q-Lernens, ausgedrückt durch tiefes Lernen __. Die __Q-Funktion __ ist die __ "Aktionswertfunktion" __, und das __Q-Lernen __ ist ein Verstärkungslernalgorithmus, der dies abschätzt. -Die Funktion __Aktionswert __ ist eine Funktion, die den erwarteten Wert der Belohnung berechnet, wenn __optimale Maßnahmen durch Eingabe von __ "Status s und Aktion a" __ ergriffen werden. Was getan wird, ist die Summe aus dem Aktionswert __, der durch Ausführen einer bestimmten Aktion erhalten wird, und dem Aktionswert __, der durch Ausführen einer möglichen Aktion im nächsten Zustand __ erhalten wird Nehmen Sie dann den Unterschied __ vom aktuellen Aktionswert und aktualisieren Sie die Funktion ein wenig (passen Sie die Lernrate an).

-Eigenschaften von __DQN sind wie folgt. Einzelheiten finden Sie im nächsten Kapitel. · __Erfahrungswiedergabe : __ Datenzeitreihen mischen, um Zeitreihenkorrelationen zu behandeln - Zielnetzwerk __: Berechnet den Fehler aus der richtigen Antwort und passt das Modell so an, dass es nahe an der richtigen Antwort liegt. Erstellen Sie nach dem Zufallsprinzip einen Stapel aus den Daten und führen Sie __Batch-Lernen __ durch. -Filtern und konvertieren Sie Bilder mit CNN: __ Faltung . - Ausschnitt __: In Bezug auf die Belohnung ist es, wenn es negativ ist, - 1, wenn es positiv ist, ist es __ + 1 __, und wenn es keine ist, ist es 0.

Experience Replay

スクリーンショット 2020-11-18 12.44.01.png

Zusammenfassung

Diesmal ist es abnormal. Vielen Dank, dass Sie so weit gelesen haben.

Recommended Posts

Tiefe Stärkung des Lernens 1 Einführung in die Stärkung des Lernens
Einführung in Deep Learning ~ Lernregeln ~
Einführung in Deep Learning ~ Backpropagation ~
[Einführung] Stärkung des Lernens
Einführung in das tiefe Lernen ~ Funktionsnäherung ~
Einführung in Deep Learning ~ Codierungsvorbereitung ~
Einführung in Deep Learning ~ Dropout Edition ~
Einführung in Deep Learning ~ Forward Propagation ~
Einführung in Deep Learning ~ CNN Experiment ~
Verbessertes Lernen, um von null bis tief zu lernen
Einführung in Deep Learning ~ Falten und Pooling ~
Einführung in das maschinelle Lernen
Einführung in Deep Learning ~ Lokalisierungs- und Verlustfunktion ~
[Lernmemorandum] Einführung in vim
Eine Einführung in das maschinelle Lernen
Super Einführung in das maschinelle Lernen
Tiefes Lernen der Verstärkung 2 Implementierung des Lernens der Verstärkung
[Einführung in die Stärkung des Lernens] Teil 1 - Epsilon-Greedy-Algorithmus im Banditenspiel
Einführung
Einführung in Deep Learning ~ CNN Experiment ~
Tiefes Lernen
Tiefes Lernen, um ohne GPU zu beginnen
Einführung in die Bibliothek für maschinelles Lernen SHOGUN
Lerne beim Machen! Tiefes Verstärkungslernen_1
[Einführung in die Stärkung des Lernens] Stärkung des Lernens, um sich vorerst zu bewegen
Versuchen Sie Q-Lernen in einem Kampf im Drakue-Stil [Einführung in die Stärkung des Lernens]
Einführung in MQTT (Einführung)
Einführung in Scrapy (1)
Einführung in Scrapy (3)
Einführung in das maschinelle Lernen: Funktionsweise des Modells
Einführung in Tkinter 1: Einführung
<Kurs> Deep Learning Day4 Stärkung des Lernens / Tensorflusses
Eine Einführung in OpenCV für maschinelles Lernen
Deep Learning Memorandum
Einführung in PyQt
So studieren Sie den Deep Learning G-Test
Zukünftiges Verstärkungslernen_1
[Linux] Einführung in Linux
Bildausrichtung: von SIFT bis Deep Learning
Python Deep Learning
Ich las "Das Lernen mit Python von der Einführung bis zur Praxis stärken", Kapitel 1
Einführung in Scrapy (4)
Deep Learning × Python
Einführung in discord.py (2)
Eine Einführung in Python für maschinelles Lernen
Einführung in Deep Learning (2) - Versuchen Sie Ihre eigene nichtlineare Regression mit Chainer-
Einführung in TensorFlow - Erläuterung der Begriffe und Konzepte des maschinellen Lernens
Ich las "Das Lernen mit Python von der Einführung bis zur Praxis stärken", Kapitel 2
[Python] Einfache Einführung in das maschinelle Lernen mit Python (SVM)
[Super Einführung in das maschinelle Lernen] Lernen Sie Pytorch-Tutorials
Eine Einführung in maschinelles Lernen für Bot-Entwickler
Ein Amateur versuchte Deep Learning mit Caffe (Einführung)
Deep Learning von Grund auf neu ① Kapitel 6 "Lerntechniken"
Eine Einführung in Cython, ohne tief zu gehen
[Einführung in StyleGAN2] Unabhängiges Lernen mit 10 Anime-Gesichtern ♬
[Super Einführung in das maschinelle Lernen] Lernen Sie Pytorch-Tutorials
[Für Anfänger] Einführung in die Vektorisierung beim maschinellen Lernen
Einführung in Cython ohne tief zu gehen -2-
Einführung in Deep Learning (1) --Chainer wird Anfängern leicht verständlich erklärt.
Erstes tiefes Lernen ~ Kampf ~