[PYTHON] Classification des Pokémon par modèle de sujet

introduction

L'article de [LDA pour l'analyse Pokémon] de haripo (https://haripo.com/articles/2016/LDA-for-Pokemon-analysis/) était intéressant. Bien que ce soit la deuxième décoction, j'ai classé Pokemon par modèle de sujet.

Structure de cet article

Modèle de sujet

Veuillez vous référer à l'article que j'ai écrit plus tôt pour le modèle de sujet.

Classification des Pokémon

Application des termes utilisés dans le modèle de sujet à la classification Pokémon Cela ressemble au tableau ci-dessous.

Modèle de sujet Classification des Pokémon
des documents Pokémon
sujet type
mot Bouge toi

Les Pokémon ont des types qui affectent les compétences que vous pouvez apprendre. Par exemple, les Pokémon de type eau sont appelés "Naminori" ou "Awa". J'ai tendance à apprendre des techniques de type eau. Il semble que cette tendance puisse être utilisée pour la classification en utilisant les techniques à retenir comme données d'observation.

Résultats et analyse

Cette fois, nous avons estimé les paramètres en utilisant la variante de l'estimation bayésienne. J'ai classé Pokémon.

Déterminer la distribution en fonction des paramètres estimés Les 10 meilleurs Pokémon de chaque sujet sont résumés. Il semble que le même type de Pokémon se rassemble.

pokemon_lda

Ensuite, nous avons résumé les 10 meilleures techniques qui ont une forte probabilité d'apparaître dans chaque sujet. Je ne peux pas tous les mettre, donc je vais mettre 3 sujets. Du haut, c'est comme la technique d'un dragon.

# probability, move

# topic 0
0.038194060809852150,Coup de poing Kiai
0.037835195362798050,Écraser
0.036841611052444170,Punch lumineux
0.034094062097912610,Au lieu
0.031582047497348980,Kiai Dama
0.030022570931390366,Punch Kamiari
0.028445813433849287,Ketaguri
0.025004928499331930,Poinçon Hono
0.023780587984568276,compteur
0.021945692094110280,Gansei Fuji

# topic 4
0.033900215309604030,voler dans un ciel
0.030482342390286497,Picorer
0.028591087641639673,Hagane no Tsubasa
0.027435959356401675,Splash Yasume
0.027380458031433918,Okaze
0.025788738790993984,Clairement
0.023034317940404975,Nepuu
0.022523589807169140,Tsubame
0.022254501055455754,Godbird
0.020131867462295738,Denkou Sekka

# topic 11
0.049065350322072170,Gekirin
0.041774262273487610,Kamikaku
0.041624388294984890,Et Ryu
0.037855463232992870,Aboiement
0.025959566718192560,griffe de dragon
0.024452559013954666,Mordant
0.023117951513882520,Ryuseigun
0.022165850178318302,Ryu no Ibuki
0.021211659635587490,queue de dragon
0.020565024347301973,Queue de fer

À propos, en supposant que toutes les techniques apparaissent avec une probabilité égale Ce sera 0,001612903 $.

Un peu plus d'analyse

Le sujet 1 est une collection d'Eveys.

001
# topic 1
0.043147518977559340,Donner
0.041203419444248310,Spécial
0.033292408675975230,Katakiuchi
0.033029453562122160,Vouloir
0.030529522626056543,Tamisage
0.025551829416613884,Hyper voix
0.024972809947129540,remuer la queue
0.024818145340899777,Voix d'écho
0.023821039582134246,Nakigoe
0.023117882965061936,Tedasuke

Je ne connais pas les Pokémon récents, donc Je ne sais pas si ce sont des techniques propres au système Evey. Certaines connaissances sont nécessaires pour analyser les résultats de la classification.

Le thème 13 semble ne pas avoir été classé.

012
# topic 12
0.057367839760812930,ronfler
0.053966900730742826,Hataki Otosu
0.045267075341040960,Par gars
0.042824715616878280,Non
0.042506636983195300,Karagenki
0.042225237649753020,Du secret
0.041397727253613630,Martèlement
0.035804309317892184,protéger
0.034668594832704050,Rinsho
0.021632999482884614,Tsubame

Dans le cas de Pokemon, il était relativement facile d'évaluer les résultats du classement. Cependant, s'il est difficile de définir un sujet, Il semble difficile d'évaluer si le résultat de la classification est bon ou mauvais. De plus, il était difficile de voir et d'analyser les résultats à chaque fois que je tournais le code.

en conclusion

Pokemon peut être classé par le modèle de sujet. C'était amusant car les résultats étaient meilleurs que prévu. Le code source ne sera pas publié.

Recommended Posts

Classification des Pokémon par modèle de sujet
Apprenez les bases de la classification de documents par traitement du langage naturel, modèle de sujet
Classer les informations liées à l'apprentissage automatique par modèle de sujet
Implémentation du modèle de sujet d'espace continu
Modèle de prédiction de langage par TensorFlow
Manipuler des modèles de sujet ~ Modèle de sujet interactif ~
Modèle de commutation de Markov par Python
Classification / régression par empilement (scikit-learn)
Modèle de classification simple avec réseau neuronal
Modèle Probit estimé par modèle de réponse binaire
Modèle généré par Variational Autoencoder (VAE)