Erstellen Sie ein Modell, das maschinelles Lernen verwendet, um die Position eines Agenten zu schätzen und das Human Wolf Intelligence-Turnier zu gewinnen

Ich nehme seit mehreren Jahren als Hobby am Human Wolf Intelligence Tournament teil, aber meine Noten sind nicht gut. Ich denke, es ist Zeit für unser Team, sich von der Regelbasis zu lösen und einen menschlichen Wolfs-Geheimdienstagenten zu schaffen, der maschinelles Lernen nutzt.

Als ersten Schritt werde ich versuchen, einen Klassifikator zu erstellen, um zu beurteilen, ob es sich um einen menschlichen Wolf handelt oder nicht, indem ich die Merkmalsmenge aus dem vergangenen Kampfprotokoll unter Bezugnahme auf "KI-Programmierung, die von der Intelligenz menschlicher Wölfe gelernt wurde" extrahiere. Wir haben das erstellte Modell jedoch noch nicht in den Geheimdienstagenten des menschlichen Wolfs integriert.

In Anbetracht der Leichtigkeit des Experimentierens haben wir uns entschieden, Java-Code (eine geringfügige Modifikation des offiziell verteilten Beispielcodes) für die Extraktion von Merkmalsmengen aus früheren Kampfprotokollen und Scikit-Learn zum Lernen und Schätzen zu verwenden. tat. Der Autor dieses Dokuments ist kein Experte für maschinelles Lernen, daher wäre ich Ihnen sehr dankbar, wenn Sie auf Fehler oder Missverständnisse hinweisen könnten.

Die Websites und Bücher, auf die ich mich bezog, sind am Ende des Satzes zusammengefasst.

Die diesmal ausgeführten Aufgaben sind wie folgt.

Spielprotokoll herunterladen --Label aus dem Kampfprotokoll und extrahiere den Funktionsumfang (fast offizieller Java-Code)
Lernen und Schätzen des binären Klassifizierungsproblems, ob es sich um einen menschlichen Wolf handelt oder nicht (Scikit-Learn of Python)

Spielprotokoll herunterladen

Laden Sie Ihr Lieblingsturnier aus dem "Past Tournament Log" unter Informationen für Entwickler des Human Wolf Intelligence Project herunter. Diesmal habe ich CEDEC 2017 heruntergeladen. * Wenn Sie es als Lerndaten verwenden, sollten Sie lieber die Ergebnisse von Wettbewerben verwenden, die die Entwickler ernsthaft optimiert haben, als kleine Wettbewerbe. Entpacke dieses Protokoll.

find cedec2017/ -type f -name "*.log.gz" -exec gunzip -d {} \;

Wenn Sie das Kampfprotokoll entpacken, finden Sie das nummerierte Verzeichnis und die darin enthaltene tatsächliche Protokolldatei (* .log). Das Human Wolf Intelligence-Turnier besteht aus 5 und 15 Spielern. In jedem Fall werden jedoch 5 Agenten / 15 Spieler repariert und 100 Schlachten ausgetragen, während ihre Positionen geändert werden. Die Protokolle in jedem Verzeichnis sind also die Kombination der teilnehmenden Agenten. Entspricht den gleichen 100 Schlachten. Dieses Mal werden wir versuchen, maschinelles Lernen unter Verwendung eines Teils von 100 Schlachten mit derselben Kombination von Agenten, die an der 15-Spieler-Schlacht teilnehmen, als Trainingsdaten und den Rest als Testdaten zu versuchen.

Um dieses Mal maschinelles Lernen mit kleinen Daten zu versuchen, erstellen Sie ein Verzeichnis mit dem Namen "cedec2017_small", kopieren Sie das Verzeichnis "004" in "cedec2017" und verwenden Sie es.

ls cedec2017_small/004
// 0300.log ... 0399.Bis zur Protokollierung werden 100 Dateien angezeigt

Fügen Sie eine Beschriftung aus dem Kampfprotokoll hinzu und extrahieren Sie die Feature-Menge

Der offizielle "LogdataToVector" der menschlichen Wolfsintelligenz war so wie er ist schwer zu verwenden, daher wurde er leicht modifiziert.
Offizieller GitHub https://github.com/sonodaatom/aiwolfBook
Wenn ich versuche, das entpackte CEDEC 2017-Protokoll zu lesen, wird das Programm gestoppt, da es eine Mülldatei enthält. ――In dem kürzlich durchgeführten Qualifikationsturnier für menschliche Wölfe werden 15 Dörfer und 5 Dörfer im Qualifying ausgetragen, aber LogdataToVector scheint nur 15 Dörfer zu unterstützen. Daher muss das Schlachtbuch von 5 Dörfern ausgeschlossen werden.
Code, der die beiden oben genannten Punkte leicht geändert hat https://github.com/sunmoonStern/aiwolfBook/tree/mybranch
(Ich habe versucht, im auskommentierten Teil eine neue Funktionsmenge hinzuzufügen, aber die Leistung wurde nicht wesentlich verbessert.)
Bei der folgenden Ausführung wurden Daten im libSVM-Format erstellt. Das Verzeichnis "data /" sollte "mkdir" sein.
Für die Kennzeichnung ist -1 ein menschlicher Wolf und 1 ein nicht menschlicher Wolf.

java -jar /{path_to_jar}/AIbook.jar book.LogdataToVector /{path_to_log}/cedec2017_small/ data/

Kombinieren Sie die 100 oben erstellten Dateien zu einer (möglicherweise nicht erforderlich).

import os
import subprocess
import sys

if __name__ == '__main__':
    if len(sys.argv) != 3:
        print('Usage: # python %s input_dir output_file' % argvs[0])
        quit()
    dir_name = sys.argv[1] # '/{path_to_data}/data/'
    files = os.listdir(dir_name)
    out_file = sys.argv[2] # '/{path_to_outfile}/new.log.txt'
    os.system('rm ' + out_file)
    for fin in files:
        files_with_path = dir_name + fin
        subprocess.call('cat ' + files_with_path + ' >> ' + out_file, shell=True)

――Die fertige libSVM-Datei sieht folgendermaßen aus ――Für die Bedeutung der einzelnen Funktionen ist es schnell, den Quellcode von "LogdataToVector" zu lesen.

Der Punkt, den Sie beim Hinzufügen Ihrer eigenen Feature-Menge beachten sollten, ist, dass Sie keine Systeminformationen verwenden sollten, die dem Spieler während des menschlichen Wolfsspiels nicht aus dem Protokoll mitgeteilt werden. Wenn Sie sich beispielsweise auf die Flüsterlinie konzentrieren, die nur von menschlichen Wölfen aus dem Protokoll verwendet werden kann, können Sie definitiv menschliche Wölfe treffen. Dies liegt jedoch daran, dass Sie einen starken Agenten erstellen möchten, der die Position eines anderen Agenten anhand der dem Spieler offengelegten Informationen zuweisen kann. Es widerspricht dem Zweck.

$ head -5 mini.log.txt
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
-1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0

Lernen / Schätzen

--Installieren Sie scikit-learn

pip install numpy
pip install scipy
pip install -U scikit-learn

Beziehen Sie sich auf das Scikit-Lerndokument und versuchen Sie, es vorerst als Black Box zu verwenden.

from sklearn.datasets import load_svmlight_file
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn.metrics import classification_report, accuracy_score

x,y = load_svmlight_file('/{path_to_log}/new.log.txt')
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
clf = svm.SVC(cache_size = 2000)
clf.fit(x_train, y_train)
y_pred = clf.predict(x_test)
print accuracy_score(y_test, y_pred)
print classification_report(y_test, y_pred)

――Ich habe dieses Ergebnis erhalten ――Da die positiven und negativen Fälle voreingenommen sind, ist unklar, ob das Ergebnis der Genauigkeit 0,82 zum Nennwert empfangen werden kann. Ich war auch besorgt, dass der Rückruf, als der Agent ein menschlicher Wolf war, extrem schlecht war.

             precision    recall  f1-score   support

       -1.0       0.74      0.20      0.31       626
        1.0       0.84      0.98      0.90      2614

avg / total       0.82      0.83      0.79      3240

Was ich zurückgelassen habe

Experimentieren Sie, indem Sie weitere Funktionen hinzufügen
Bewerten Sie das Modell mit einer Kreuzvalidierung anstelle der groben Methode, 30% der Daten als Testdaten zu verwenden.
Als ich versuchte, das gesamte CEDEC 2017-Protokoll zu verwenden, funktionierte es nicht. Finden Sie also einen Weg, es zu skalieren.
Ich habe versucht, zufällige Wald zu verwenden und es war schnell, aber die Leistung war ein wenig schlecht.
Experimentieren Sie mit verschiedenen Algorithmen, um die richtigen Parameter zu finden
Verwenden Sie nur das endgültige Protokoll, in dem nur starke Agenten am Kampfprotokoll teilnehmen sollen (es ist nicht bekannt, ob die 100 Schlachten im Qualifying und im Finale vom Protokoll unterschieden werden können).

Referenz

KI-Programmierung durch menschliche Wolfsintelligenz gelernt
Einführungsbuch für die Entwicklung der Intelligenz menschlicher Wölfe
In Kapitel 5 erfahren Sie insbesondere, wie Sie einen menschlichen Wolf mithilfe von maschinellem Lernen zu einem intelligenten Agenten machen können.
Human Wolf Intelligence Project
Sie können den Zeitplan des Human Wolf Intelligence-Turniers, Ankündigungen verwandter Ereignisse wie Seminare und Trainingslager, Protokolle vergangener Turniere und Quellcodes vergangener Turniere herunterladen. --scikit-learn SVM-Dokumentation
http://scikit-learn.org/stable/modules/svm.html#svm

[PYTHON] Erstellen eines Positionsschätzungsmodells für den Intelligenzwettbewerb menschlicher Wölfe mithilfe von maschinellem Lernen