Créez un modèle qui utilise l'apprentissage automatique pour estimer la position d'un agent afin de gagner le tournoi Human Wolf Intelligence

Je participe au tournoi Human Wolf Intelligence en tant que passe-temps depuis plusieurs années, mais mes notes ne sont pas bonnes. Je pense qu'il est temps pour notre équipe de rompre avec la base de règles et de créer un agent de renseignement humain-loup qui utilise l'apprentissage automatique.

Comme première étape pour cela, je vais essayer de faire un classificateur pour juger s'il s'agit d'un loup humain ou non en extrayant la quantité de caractéristiques du journal de bataille passé en référence à "la programmation d'IA apprise par l'intelligence humaine du loup". Cependant, nous n'avons pas encore incorporé le modèle créé dans l'agent de renseignement humain loup.

Compte tenu de la facilité d'expérimentation, nous avons décidé d'utiliser le code Java (une modification mineure de l'exemple de code officiellement distribué) pour l'extraction de la quantité de fonctionnalités à partir des journaux de bataille passés, et scikit-learn pour l'apprentissage et l'estimation. fait. L'auteur de ce document n'est pas un expert en apprentissage automatique, je vous serais donc très reconnaissant de bien vouloir signaler des erreurs ou des malentendus.

Les sites et livres auxquels j'ai fait référence sont résumés à la fin de la phrase.

Les tâches effectuées cette fois sont les suivantes.

--Télécharger le journal des matchs --Étiquette du journal de bataille et extraire le montant de la fonctionnalité (code Java presque officiel) --Apprentissage et estimation du problème de classification binaire de savoir s'il s'agit ou non d'un loup humain (Scikit-learn de Python)

Télécharger le journal des matchs

Téléchargez votre tournoi préféré à partir du "Journal des tournois passés" dans Information pour les développeurs de Human Wolf Intelligence Project. Cette fois, j'ai téléchargé CEDEC 2017. * Lorsque vous les utilisez comme données d'apprentissage, il est préférable d'utiliser les résultats de concours que les développeurs ont sérieusement réglés, plutôt que des concours à petite échelle. Décompressez ce journal.

find cedec2017/ -type f -name "*.log.gz" -exec gunzip -d {} \;

Lorsque vous décompressez le journal de combat, vous trouverez le répertoire numéroté et le fichier journal réel (* .log) qu'il contient. Il y a 5 et 15 joueurs dans le tournoi Human Wolf Intelligence, mais dans chaque cas, 5 agents / 15 joueurs seront corrigés et 100 batailles auront lieu tout en changeant de position, donc les journaux dans chaque répertoire sont la combinaison des agents participants. Correspond aux mêmes 100 batailles. Cette fois, nous allons essayer l'apprentissage automatique en utilisant une partie de 100 batailles avec la même combinaison d'agents participant à la bataille à 15 joueurs que les données d'entraînement et le reste comme données de test.

Cette fois, pour essayer le machine learning avec de petites données, créez un répertoire appelé cedec2017_small, copiez le répertoire de 004 dans cedec2017 et utilisez-le.

ls cedec2017_small/004
// 0300.log ... 0399.100 fichiers sont affichés jusqu'à la journalisation

Ajoutez une étiquette du journal de bataille et extrayez le montant de la fonctionnalité

Le LogdataToVector officiel de l'intelligence humaine du loup était difficile à utiliser tel quel, il a donc été légèrement modifié.
GitHub officiel https://github.com/sonodaatom/aiwolfBook --Lorsque j'essaie de lire le journal CEDEC 2017 décompressé, le programme s'arrête car il contient un fichier d'ordures. ――Dans le récent tournoi de renseignement sur les loups humains, 15 villages et 5 villages sont organisés lors des qualifications, mais LogdataToVector semble ne soutenir que 15 villages, il est donc nécessaire d'exclure le journal de bataille de 5 villages. --Code qui a légèrement modifié les deux points ci-dessus https://github.com/sunmoonStern/aiwolfBook/tree/mybranch
(J'ai essayé d'ajouter une nouvelle quantité de fonctionnalités dans la partie commentée, mais il n'y a pas eu beaucoup d'amélioration des performances) --Lorsqu'il est exécuté comme suit, les données au format libSVM ont été créées. Le répertoire data / doit être mkdir. --Pour l'étiquetage, -1 est un loup humain et 1 est un loup non humain.

java -jar /{path_to_jar}/AIbook.jar book.LogdataToVector /{path_to_log}/cedec2017_small/ data/

--Combinez les 100 fichiers créés ci-dessus en un seul (peut ne pas être nécessaire)

import os
import subprocess
import sys

if __name__ == '__main__':
    if len(sys.argv) != 3:
        print('Usage: # python %s input_dir output_file' % argvs[0])
        quit()
    dir_name = sys.argv[1] # '/{path_to_data}/data/'
    files = os.listdir(dir_name)
    out_file = sys.argv[2] # '/{path_to_outfile}/new.log.txt'
    os.system('rm ' + out_file)
    for fin in files:
        files_with_path = dir_name + fin
        subprocess.call('cat ' + files_with_path + ' >> ' + out_file, shell=True)

――Le fichier libSVM terminé ressemble à ceci

Pour la signification de chaque fonctionnalité, il est rapide de lire le code source de LogdataToVector.
Le point à garder à l'esprit lorsque vous ajoutez votre propre quantité de fonctionnalités est que vous ne devez pas utiliser les informations système qui ne sont pas divulguées au joueur pendant le jeu du loup humain à partir du journal. Par exemple, si vous vous concentrez sur la ligne de chuchotement qui ne peut être utilisée que par le loup humain à partir du journal, vous pouvez certainement frapper le loup humain, mais c'est parce que vous voulez créer un agent fort qui peut attribuer la position d'un autre agent à partir des informations divulguées au joueur. Cela va à l'encontre du but.

$ head -5 mini.log.txt
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0
-1 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:0

Apprentissage / estimation

--Installez scikit-learn

pip install numpy
pip install scipy
pip install -U scikit-learn

Reportez-vous au document scikit-learn et essayez de l'utiliser comme une boîte noire pour le moment.

from sklearn.datasets import load_svmlight_file
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn.metrics import classification_report, accuracy_score

x,y = load_svmlight_file('/{path_to_log}/new.log.txt')
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
clf = svm.SVC(cache_size = 2000)
clf.fit(x_train, y_train)
y_pred = clf.predict(x_test)
print accuracy_score(y_test, y_pred)
print classification_report(y_test, y_pred)

――J'ai ce résultat ―― Étant donné que les cas positifs et négatifs sont biaisés, il est difficile de savoir si le résultat de la précision 0,82 peut être reçu à sa valeur nominale. De plus, je craignais que le rappel lorsque l'agent était un loup humain soit extrêmement mauvais.

             precision    recall  f1-score   support

       -1.0       0.74      0.20      0.31       626
        1.0       0.84      0.98      0.90      2614

avg / total       0.82      0.83      0.79      3240

Ce que j'ai laissé derrière

Expérimentez en ajoutant plus de fonctionnalités
Évaluez le modèle avec une validation croisée au lieu de la méthode brute consistant à utiliser 30% des données comme données de test --Lorsque j'ai essayé d'apprendre en utilisant l'intégralité du journal CEDEC 2017, cela n'a pas fonctionné, alors trouvez un moyen de le mettre à l'échelle.
J'ai essayé d'utiliser une forêt aléatoire et c'était rapide, mais les performances étaient un peu mauvaises. —— Expérimentez avec différents algorithmes pour trouver les bons paramètres --Utilisez uniquement le journal final, dans lequel seuls les agents puissants sont censés participer au journal de bataille (on ne sait pas si vous pouvez faire la distinction entre les 100 courses de qualification et finales à partir du journal)

référence

Programmation IA apprise par l'intelligence humaine du loup
Livre d'introduction au développement de l'intelligence du loup humain ―― Reportez-vous au chapitre 5 en particulier pour savoir comment créer un agent de renseignement humain loup à l'aide de l'apprentissage automatique.
Projet Human Wolf Intelligence
Vous pouvez télécharger le calendrier du tournoi Human Wolf Intelligence, les annonces d'événements connexes tels que les séminaires et les camps d'entraînement, les journaux des tournois passés et les codes sources des tournois passés. --scikit-learn documentation SVM
http://scikit-learn.org/stable/modules/svm.html#svm

[PYTHON] Création d'un modèle d'estimation de position pour la compétition d'intelligence humaine de loup à l'aide de l'apprentissage automatique