What Dies ist ein Artikel, der zusammenfasst, was mir aufgefallen ist und was ich beim Erlernen des maschinellen Lernens mit Chainer untersucht habe. Dieses Mal werden wir das Training neuronaler Netze studieren.
Es wurde nach meinem Verständnis geschrieben, daher kann es falsch sein. Ich werde alle Fehler korrigieren, bitte vergib mir.
Content
Einfach ausgedrückt: Verbessern Sie die Genauigkeit des Modells und machen Sie es für den Benutzer intelligenter.
Wenn wir tiefer in das neuronale Netzwerk eintauchen, werden wir die Zielfunktion optimieren. Die folgenden zwei typischen Zielfunktionen werden vorgestellt.
Während der durchschnittliche quadratische Fehler eine Methode ist, um die optimale Lösung für die Parameter des Modells zu finden, kann eine Lösung gleichzeitig gefunden werden. Ich verstehe, dass die Methode zur Vorhersage, dass dies wahrscheinlicher ist, die Kreuzentropie ist.
Gradientenabstiegsmethode: Wie der Name schon sagt, eine Methode zum Aktualisieren von Parametern aus dem Gradienten Mini-Batch-Lernmethode: Ableitung jeder Zielfunktion durch Kombination mehrerer Datensätze. Und wie man die Parameter aktualisiert, indem man den Durchschnittswert der Zielfunktion nimmt (ich bin nicht sicher)
Wenn der Wert des Gradienten der Aktivierungsfunktion klein ist, sind auch die Parameter jeder Schicht klein. Dies wird als Verschwinden des Gradienten bezeichnet. Gibt es eine Einschränkung der Aktivierungsfunktion? (Divergiert nicht, konvergiert ...) Sollte es 1 oder weniger sein, da es als Wahrscheinlichkeit ausgegeben wird? ?? ?? Dort wird die ReLU-Funktion eingeführt, aber wer und wie haben Sie sie gefunden ...? Ich werde es aktualisieren, wenn ich die Details kenne.
Ich frage mich, ob tiefes Lernen möglich wurde, indem das Problem des Verschwindens von Gradienten gelöst wurde
Comment Vorerst habe ich mir einen Überblick über maschinelles Lernen verschafft. Als nächstes möchte ich ein konkretes Programm machen.
Deshalb habe ich dieses Buch gekauft. Um ehrlich zu sein, wusste ich nicht, was ich kaufen sollte, weil ich zu unerfahren war, aber als ich mir den Index der Tabelle ansah, ** Da es die in Chainer erlernte Bibliothek verwendet, ist es für tatsächliche Schlachten geeignet ** ** Einführung in die Erstellung von Webanwendungen, die dazu beitragen können, das Programm öffentlich verfügbar zu machen ** Also habe ich beschlossen, es zu kaufen.
Also studiere dieses Buch ** SCHRITT.1 Tatsächlicher Kampf um maschinelles Lernen SCHRITT 2 Master Pyhton auf App-Release-Level **
Ich werde mein Bestes geben, um das nächste Ziel zu erreichen.
Recommended Posts