(Der Chokozainer RL wurde am 8. Dezember 2019 aktualisiert.)
Es ist für KI-Anfänger gedacht, von Schülern der Mittelstufe bis zu Studenten der Universität. Ich habe bis zu 27 Verstärkungslernserien geschrieben. Es war ungefähr ein Monat, weil es ein Tempo pro Tag war. Ich werde eine Zusammenfassung schreiben, die es einfacher macht, von hier aus zu beginnen. Es gibt nichts Neues.
Wenn Sie das maschinelle Lernen mit der GPU einfach starten möchten, ist das Labor kostenlos. Ich empfehle es daher. Keine mühsame Installation erforderlich. Dies allein funktioniert jedoch nicht. Fassen wir das Verfahren zusammen. Ich habe chainerRL als Framework gewählt. Ich mag Tensorflow, aber ich habe es nicht benutzt, also ... Ich denke, ich werde bald versuchen, Tensorflow zu verwenden. Ich werde es in der Mitte schreiben, aber schauen wir uns den Quellcode so gut wie möglich an. Es wird auf Github veröffentlicht. Der Funktionsname ist leicht zu verstehen, daher denke ich, dass er leicht zu verstehen ist. Der Chainer ist auf Englisch leicht zu lesen, wahrscheinlich weil er von Japanern hergestellt wird. Oder besser gesagt, wenn Sie es mit Chrom ins Japanische übersetzen, ist es richtiges Japanisch. Was ist mit Tensorflow? ?? ?? ist. Wir haben chokozainerRL veröffentlicht, einen Wrapper für chainerRL. Ich habe nicht viel getan, aber ich hoffe, dass es für das "menschliche Lernen" beim verstärkten Lernen nützlich sein wird.
Bitte erstellen Sie von hier aus.
Erstellen Sie ein Google-Konto https://support.google.com/accounts/answer/27441?hl=ja
Von hier aus öffnen. https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja Lassen Sie es uns als Lesezeichen speichern.
Notebook öffnen
Wählen Sie die Registerkarte GitHub. Suche mit Chokozainer, ipynbs/abc.ipynb Wählen.
Das geöffnete abc.ipynb kann nicht so verwendet werden, wie es ist. Erstellen Sie daher eine Kopie auf dem Laufwerk.
Benennen Sie dann die kopierte Datei um.
Das Ausführen eines Notebooks wird auf verschiedenen Websites ausführlich erläutert. Machen Sie es also bitte selbst. Vor dem Lernen konnten Sie nur wenige Schritte ausführen. Nach dem Lernen können Sie jedoch feststellen, dass Sie bis zu 200 Einstellungsschritte ausgleichen können. Sie können ein Video wie dieses erstellen.
Das Ergebnis der Lernausführung sieht folgendermaßen aus.
Da die Ausführungszeit (Sekunden) abgelaufen ist, ist das Lernen in etwa 15 Minuten abgeschlossen.
Recommended Posts