[PYTHON] Pokemon-Klassifizierung nach Themenmodell

Einführung

Der Artikel von haripos LDA für Pokemon-Analyse war interessant. Obwohl es das zweite Abkochen ist, habe ich Pokemon nach Themenmodellen klassifiziert.

Struktur dieses Artikels

Themenmodell

Weitere Informationen zum Themenmodell finden Sie in dem Artikel, den ich zuvor geschrieben habe.

Pokemon Klassifizierung

Anwenden der im Themenmodell verwendeten Begriffe auf die Pokemon-Klassifizierung Es sieht aus wie in der folgenden Tabelle.

Themenmodell Pokemon Klassifizierung
Unterlagen Pokémon
Thema Art
Wort Bewegung

Pokemon haben Typen, die sich auf die Fähigkeiten auswirken, die Sie erlernen können. Zum Beispiel wird Pokemon vom Wassertyp "Naminori" oder "Awa" genannt. Ich neige dazu, Wassertechniken zu lernen. Es scheint, dass diese Tendenz zur Klassifizierung unter Verwendung der Techniken verwendet werden kann, an die man sich als Beobachtungsdaten erinnert.

Ergebnisse und Analyse

Dieses Mal haben wir die Parameter unter Verwendung der varianten Bayes'schen Schätzung geschätzt. Ich habe Pokemon klassifiziert.

Bestimmen Sie die Verteilung anhand der geschätzten Parameter Die Top 10 Pokémon jedes Themas sind zusammengefasst. Es scheint, dass sich die gleiche Art von Pokémon versammelt.

pokemon_lda

Als nächstes haben wir die Top 10 Techniken zusammengefasst, bei denen eine hohe Wahrscheinlichkeit besteht, dass sie in jedem Thema auftreten. Ich kann nicht alle setzen, also werde ich 3 Themen setzen. Von oben ist es wie eine Drachentechnik.

# probability, move

# topic 0
0.038194060809852150,Kiai Schlag
0.037835195362798050,Drücken
0.036841611052444170,Glühpunsch
0.034094062097912610,Stattdessen
0.031582047497348980,Kiai Dama
0.030022570931390366,Kamiari Schlag
0.028445813433849287,Ketaguri
0.025004928499331930,Hono Punsch
0.023780587984568276,Zähler
0.021945692094110280,Gansei Fuji

# topic 4
0.033900215309604030,fliege durch einen Himmel
0.030482342390286497,Picken
0.028591087641639673,Hagane no Tsubasa
0.027435959356401675,Splash Yasume
0.027380458031433918,Okaze
0.025788738790993984,Deutlich
0.023034317940404975,Nepuu
0.022523589807169140,Tsubame
0.022254501055455754,Godbird
0.020131867462295738,Denkou Sekka

# topic 11
0.049065350322072170,Gekirin
0.041774262273487610,Kamikaku
0.041624388294984890,Wie wäre es mit Ryu?
0.037855463232992870,Gebell
0.025959566718192560,Drachenklaue
0.024452559013954666,Beißen
0.023117951513882520,Ryuseigun
0.022165850178318302,Ryu no Ibuki
0.021211659635587490,Drachenschwanz
0.020565024347301973,Eisenschwanz

Übrigens unter der Annahme, dass alle Techniken mit gleicher Wahrscheinlichkeit erscheinen Es wird $ 0.001612903 $ sein.

Ein bisschen mehr Analyse

Thema 1 ist eine Sammlung von Eveys.

001
# topic 1
0.043147518977559340,Geben
0.041203419444248310,Besondere
0.033292408675975230,Katakiuchi
0.033029453562122160,Wollen
0.030529522626056543,Sichtung
0.025551829416613884,Hyper Voice
0.024972809947129540,wedeln mit dem Schwanz
0.024818145340899777,Echo Stimme
0.023821039582134246,Nakigoe
0.023117882965061936,Tedasuke

Ich bin also nicht mit den neuesten Pokémon vertraut Ich weiß nicht, ob dies Techniken sind, die dem Evey-System eigen sind. Für die Analyse der Klassifizierungsergebnisse sind einige Kenntnisse erforderlich.

Thema 13 scheint nicht klassifiziert worden zu sein.

012
# topic 12
0.057367839760812930,schnarchen
0.053966900730742826,Hataki Otosu
0.045267075341040960,Pro Kerl
0.042824715616878280,Nein
0.042506636983195300,Karagenki
0.042225237649753020,Aus dem Geheimnis
0.041397727253613630,Stampfen
0.035804309317892184,schützen
0.034668594832704050,Rinsho
0.021632999482884614,Tsubame

Im Fall von Pokemon war es relativ einfach, die Klassifizierungsergebnisse auszuwerten. Wenn es jedoch schwierig ist, ein Thema zu definieren, Es scheint schwierig zu beurteilen, ob das Klassifizierungsergebnis gut oder schlecht ist. Außerdem war es schwierig, die Ergebnisse jedes Mal zu sehen und zu analysieren, wenn ich den Code drehte.

abschließend

Pokemon kann nach dem Themenmodell klassifiziert werden. Es hat Spaß gemacht, weil die Ergebnisse besser waren als erwartet. Der Quellcode wird nicht veröffentlicht.

Recommended Posts

Pokemon-Klassifizierung nach Themenmodell
Lernen Sie die Grundlagen der Dokumentklassifizierung durch Verarbeitung natürlicher Sprache, Themenmodell
Klassifizieren Sie Informationen zum maschinellen Lernen nach Themenmodellen
Kontinuierliche Implementierung des Weltraumthemenmodells
Sprachvorhersagemodell von TensorFlow
Themenmodelle bearbeiten ~ Interaktives Themenmodell ~
Markov-Schaltmodell von Python
Klassifikation / Regression durch Stapeln (Scikit-Learn)
Einfaches Klassifizierungsmodell mit neuronalem Netz
Geschätztes Probit-Modell nach binärem Antwortmodell
Modell generiert von Variational Autoencoder (VAE)