[PYTHON] Beginnen wir mit der multivariaten Analyse und der Hauptkomponentenanalyse mit Pokemon! Zusammenarbeit zwischen R und Tableau

Pokemon Go wurde im Herbst 2015 angekündigt und ist weltweit zu einem sozialen Phänomen geworden, aber es ist sowohl bei Kindern als auch bei Erwachsenen immer noch äußerst beliebt.

Ich denke, der Grund für seine Beliebtheit ist, dass Pokemons Charaktere einzigartig und abwechslungsreich sind.

 

Ich war auch ein absoluter Anfänger in Pokemon, aber ich frage mich, ob ich aus Pokemon-Daten eine interessante Analyse durchführen kann.

 

Globale Website des Data Science-Wettbewerbs: Der auf Kaggle veröffentlichte Datensatz scheint eine ganze Reihe von Daten über Pokemon zu enthalten. Pokemon scheint ein interessantes Forschungsthema für Datenwissenschaftler zu sein!

 

Dieses Mal werde ich versuchen, die Attributdaten von Pokemon aus dem Kaggle-Datensatz mithilfe der Hauptkomponentenanalyse zu verstehen.

 

Erstens scheint Pokemon verschiedene Attribute zu haben, wie CP (Kampfpunkt: Kampfkraft), HP (Trefferpunkt: körperliche Stärke), Gewicht, Größe usw.

 

Referenz:

[Pokemon GO] Was ist CP? Erklären Sie, wie Sie die Obergrenze und den Anfangswert / CP zum Zeitpunkt der Evolution erhöhen können

https://pokemongo.gamewith.jp/article/show/23752

 

Wenn Sie ein Streudiagramm dieser Attribute zeichnen, können Sie die Korrelation jedes Attributs sehen (wenn beispielsweise der Körper groß ist, ist auch die HP groß ...). Wenn jedoch die Anzahl der Variablen zunimmt, ist dies auf den ersten Blick nicht klar. richtig.

 

Ist es nicht möglich, die Attribute von Pokemon auf einer zweidimensionalen Karte effektiver darzustellen und ähnliche Pokemon-Typen zu finden?

 

Dieses Mal möchte ich mir eine Visualisierungsmethode vorstellen, mit der Sie die Attributverteilung von Pokemon mithilfe der PCA (Principle Component Analysis) auf einen Blick sehen können.

 

Was ist eine Hauptkomponentenanalyse? , "Durch die Korrelation multivariater Daten wird der Informationsverlust minimiert. Reduzieren Sie es, während Sie es unterdrücken, auf eine kleine Menge synthetischer Variablen, reduzieren Sie die Dimensionen und analysieren Sie es ... "

 

Kurz gesagt, HP, CP, Offensivkraft, Defensivkraft, körperliche Stärke, Körpergröße usw. Für Menschen ist es schwierig zu verstehen, ob es viele Attribute gibt. Stellen Sie also ähnliche Attribute zusammen und bilden Sie eine schöne Hauptkomponente Ich verstehe, dass es darum geht, das zu extrahieren, was sein soll, und einfach zu denken. (Es tut mir leid für das grobe Verständnis.)

 

Ich werde aus dem Ergebnis vorstellen! !!

Die Ergebnisse der Hauptkomponentenanalyse von 151 Pokemon der ersten Generation und der Hauptkomponentenanalyse mit Tableau sind wie folgt.

In der oberen rechten Ecke des Bildschirms haben Größe (Größe_m) und Gewicht (Gewicht_kg) ähnliche Komponenten. Je größer das Individuum, desto schwerer ist es, was natürlich ist. Dies sind ähnliche Inhaltsstoffe, da sie auch eine bessere Abwehr haben.

Snorax, Gyarados und Onix sind ähnliche Gruppen wie große und defensive Pokémon.

Wenn man unten rechts auf dem Bildschirm nachschaut, kann man sagen, dass Geschwindigkeit und sp_attack ähnliche Komponenten sind. Das Pokemon unten rechts auf dem Bildschirm ist klein, aber schnell und scheint ein Pokemon mit einem starken Spezialangriff zu sein. Gengar und Alakazam haben solche Eigenschaften.

Und es gibt Mewtwo als Sprungwert unten rechts auf dem Bildschirm, aber das ist nicht groß, aber es scheint trotzdem extrem stark zu sein.

Mit Blick auf das Ganze ist die Y-Achse oben groß und die Verteidigung hoch, die Unterseite ist klein und fantastisch

Man kann sagen, dass die X-Achse insgesamt rechts stärker und links insgesamt schwächer ist (MagiCarp Koiking, Caterpie Caterpie, Weedle Beadle).

Auf diese Weise wird es meiner Meinung nach durch die Analyse der Hauptkomponenten einfacher, Pokemon aus der Vogelperspektive zu verstehen, wenn Pokemon mit ähnlichen Eigenschaften oder Pokemon mit herausragenden Eigenschaften gefunden wird.

Als nächstes möchte ich die mit der Analyse verbundenen Schritte vorstellen.

 

Lassen Sie uns die Daten tatsächlich bringen und uns darauf vorbereiten.

Dieses Mal verwenden wir den folgenden Datensatz aus den auf Kaggle veröffentlichten Daten.

① Pokemon Go: 151 Pokemon and battle stats

Es gibt Informationen zu 151 Arten von Pokemon MAX CP und MAX HP der ersten Generation.

https://www.kaggle.com/abcsds/pokemongo

 

② The Complete Pokemon Dataset

Zusätzlich zu den 802 Pokemon-Attributen gibt es eine Fülle von Daten wie Gewicht, Größe und Erfassungsrate. https://www.kaggle.com/rounakbanik/pokemon

Fahren wir mit der Analyse anhand dieser Daten fort.

 

Dieses Mal bereiten wir die Daten mit Tableau Prep vor, einem Tool zur Datenvorbereitung.

Mach Folgendes:

+ Löschen Sie nicht benötigte Felder (nur die erforderlichen Felder werden verwendet)

+ Kombinieren Sie zwei Datensätze mit der Pokemon-ID (ID-Informationen, die nur für Pokemon gelten, werden zugewiesen).

+ Daten mit fehlenden Werten löschen (fehlendes Gewicht) (Wenn Werte fehlen, kann die Hauptkomponentenanalyse nicht durchgeführt werden, daher ist dies eine Verschwendung, aber ich werde sie hier verwerfen.)

Da Sie die Verteilung der Daten in Tableau Prep sehen können, können Sie sehen, dass Angriff und Verteidigung normal verteilt zu sein scheinen.

(Hinweis: Der Bildschirm ist ein Screenshot von Project Maestro.)

Führen Sie nun eine Hauptkomponentenanalyse mit R durch, wobei Sie den von Tableau Prep erstellten Datensatz als Eingabe verwenden.

Laden Sie die Daten in R und verwenden Sie prcomp, um die Hauptkomponenten zu berechnen.

Klicken Sie hier, um eine Hauptkomponentenanalyse mit R durchzuführen

http://lovedata.main.jp/2017/09/11/主成分分析(pca)をtableau-とr連携でやってみる/

Bitte beziehen Sie sich auf.

> data <- as.data.frame(PRICOMPdata151) > row.names(data) <- data[,2] > data = data [,3:11] > result = prcomp(data,scale=TRUE) > biplot(result)

 

Geben Sie zunächst das Diagramm der Hauptkomponentenanalyse mit R an. Sie könnten die Handlung schreiben ... Irgendwie ist sie gut verteilt. Aber damit können Sie die überlappenden Zeichen überhaupt nicht sehen und das Pokémon, das Sie sehen möchten, nicht hervorheben. Verwenden wir Tableau etwas mehr für eine unterhaltsame Visualisierung.

* Umfangreiche Visualisierung mit Tableau.

Es ist genau die gleiche Methode wie in diesem Artikel, aber es fügt die Hauptkomponentendaten als neues Feld zum ursprünglichen Datensatz hinzu.

Dies wird an CSV ausgespuckt und von Tableau aus visualisiert.

> x1 <- resultx[,1] > x2 <- resultx[,2] > data1 <- cbind(PRICOMPdata151,x1,x2) > data1

> write.csv(data1,"c:/tmp/Rstudy/Pokemon_pcomp.csv")

 

Es gibt eine Site namens Pokedex.org . Wenn Sie PokeDex (Pokemon-Nummer) an diese Site übergeben, wird die Erklärung von Pokemon angezeigt. .. Das ist nützlich. Die Pokedex-Informationen sind bereits im Datensatz enthalten, daher übergebe ich sie als Dashboard-URL-Aktion.

Sie können ein solches Dashboard erstellen, indem Sie eine URL-Aktion hinzufügen.

 

Hier erfahren Sie, wie Sie Pokemon-Symbole mithilfe einer benutzerdefinierten Form in einem Streudiagramm platzieren. Umgang mit 718 Pokemon-Formen in Tableau

Dies macht die Attribute von Pokemon viel einfacher zu verstehen. Es ist leicht zu verstehen, selbst wenn Sie Glanzlichter und Filter hinzufügen.

 

Tableau Public ist von hier .

 

Je mehr Sie über Pokemon wissen, desto tiefer ist es und es ist auch als Forschungsthema für die Datenanalyse interessant.

Wenn Sie weitere interessante Ideen zu Pokemon haben, würde ich gerne eine Analyse versuchen.

 

Wir hoffen, Sie finden dies hilfreich.

Recommended Posts

Beginnen wir mit der multivariaten Analyse und der Hauptkomponentenanalyse mit Pokemon! Zusammenarbeit zwischen R und Tableau
Dimensionskomprimierung durch Selbstcodierer- und Hauptkomponentenanalyse
Koordinierte Filterung mit Hauptkomponentenanalyse und K-Mittel-Clustering
Hauptkomponentenanalyse mit Livedoor News Corpus --Practice--
Hauptkomponentenanalyse mit Livedoor News Corpus - Vorbereitung--
Ich habe versucht, die Hauptkomponenten mit Titanic-Daten zu analysieren!
Dies und das der Hauptkomponentenanalyse
2. Multivariate Analyse in Python 3-2. Hauptkomponentenanalyse (Algorithmus)
Clustering und Hauptkomponentenanalyse nach der K-Means-Methode (Anfänger)
Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus
Hauptkomponentenanalyse mit Python von nim mit nimpy
Hauptkomponentenanalyse (PCA) und unabhängige Komponentenanalyse (ICA) mit Python
2. Multivariate Analyse in Python 3-1. Hauptkomponentenanalyse (Scikit-Learn)
Hauptkomponentenanalyse (Hauptkomponentenanalyse: PCA)
Hauptkomponentenanalyse zum Anfassen mit PyCaret [Normalisierung + Visualisierung (grafisch)] Memo