In diesem Bereich habe ich als Außenseiter "die Theorie des maschinellen Lernens" überhaupt nicht studiert. Ich werde Othellos KI machen. Klicken Sie hier für die Site, auf die verwiesen wird ・ Ultra-einfache Implementierung von DQN (Deep Q Network) mit TensorFlow-Introduction-
Wenn Sie das Konzept grob erklären Zwei künstliche Intelligenzen konfrontieren Othello ernsthaft, Rette die letztere KI und kämpfe gegen mich (Mensch). Deshalb.
Meine Umgebung ist wie folgt. OS ・ Ubuntu Entwicklungsumgebung ・ Python 3.5
Ich denke, dass es in dieser Umgebung funktioniert Erstellen einer Ubuntu-Python-Entwicklungsumgebung auf der Google Cloud Platform
Laden Sie zunächst den Quellcode herunter.
Die Quelle ist hier.
$ git clone https://github.com/sasaco/tf-dqn-reversi.git
Wenn die Umgebung bereit ist, wechseln Sie in das Quellcodeverzeichnis und klicken Sie auf train.py, um mit dem Lernen zu beginnen.
python
$ cd tf-dqn-reversi
$ python train.py
Wenn Sie das folgende Protokoll sehen, lernen Sie richtig.
python
player:1 | pos:32 | LOSS: 0.0000 | Q_MAX: 0.0041
player:2 | pos:15 | LOSS: 0.0000 | Q_MAX: 0.0009
…
layer:2 is only pos:56
player:2 | pos:56 | LOSS: 0.0000 | Q_MAX: 0.8607
EPOCH: 999/999 | WIN: player2
winner is player2
Es wird einige Stunden dauern, bis die Studie abgeschlossen ist. Lassen Sie uns mit dem trainierten Modell testen.
python
$ python FightWithAI.py
------------- GAME START ---------------
***Benutzer drehen ○***
0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
24 25 26 ○ ● 29 30 31
32 33 34 ● ○ 37 38 39
40 41 42 43 44 45 46 47
48 49 50 51 52 53 54 55
56 57 58 59 60 61 62 63
Bitte geben Sie die Nummer ein
[43, 34, 29, 20]
>>>
Wenn das Spiel wie oben beginnt, sind Sie erfolgreich. Hat es richtig funktioniert? Das Ergebnis des Spiels wird in ~ Iza Battle Edition ~ geschrieben.
Nächstes Mal liefert die Implementierungsversion.
Recommended Posts