[PYTHON] Pratique d'analyse des données (acquisition / organisation / confirmation des données) -Evénement de Dereste 2001e frontière-
Aperçu
- Je veux pratiquer l'analyse des données de séries chronologiques, donc je vais l'essayer avec "les données limites de 2001 du classement pt d'événement de Dereste".
- Si possible, j'aimerais dire: "Prédisez la ligne de 2001 au moment où l'événement commence." (J'ai un sentiment dur)
- En guise de préparation préliminaire, cette page va acquérir, organiser et vérifier le plan.
- La quantité de fonctionnalités n'est pas suffisante, je voudrais donc en ajouter et creuser plus profondément
- Les scripts créés cette fois sont a1 ~ a4 de ici.
Données utilisées
[Imus Dereste Strategy Summary wiki [Idol Master Cinderella Girls Starlight Stage]](https://imascg-slstage-wiki.gamerch.com/%E3%82%A4%E3%83%99%E3%83%B3% Données E3% 83% 88% E3% 83% 87% E3% 83% BC% E3% 82% BF)
Résumé des données
Nom |
sens |
Échelle variable |
Type de données |
Nom de l'événement |
Nom de l'événement |
Échelle nominale |
Chaîne |
2001e frontière pt |
2001 Non. Points limites (je veux savoir à ce sujet) |
Échelle proportionnelle |
Valeur numérique (entier) |
format |
Format de l'événement (Attapon, Groove, Carnival) |
Échelle nominale |
Chaîne de caractères (catégorie) |
attribut |
Attributs d'événement (format)=(Uniquement pour Groove) |
Échelle nominale |
Chaîne de caractères (catégorie) |
Date |
Date de début de l'événement |
Échelle d'intervalle |
Type de date |
période |
Durée de l'événement (heures) |
Échelle proportionnelle |
Valeur numérique (entier) |
- Nombre de données: 95
- Disparu
- Attribut: 63 manquants. Manquant sauf que le format est Groove
- Période: 3 disparus. Manquant si le format est Carnaval
- Statistiques
- Nom de l'événement: pas de doublon
- Bordure 2001: aucune valeur anormale. La moyenne est supérieure à la médiane
- Format: 3 types. Jusqu'à 60 doublons
- Date: pas de doublons
- Attribut: 3 types. Jusqu'à 11 doublons
- Période: pas de valeurs aberrantes. La moyenne est supérieure à la médiane
|
un événement |
2001e |
format |
Date |
attribut |
période |
count |
95 |
95 |
95 |
95 |
32 |
92 |
unique |
95 |
NaN |
3 |
95 |
3 |
NaN |
top |
Fanfare de fan de passion |
NaN |
Attapon |
2015/12/4 |
Vo |
NaN |
freq |
1 |
NaN |
60 |
1 |
11 |
NaN |
mean |
NaN |
95234.4 |
NaN |
NaN |
NaN |
183.5 |
std |
NaN |
42973.7 |
NaN |
NaN |
NaN |
19.1 |
min |
NaN |
40096 |
NaN |
NaN |
NaN |
150 |
25% |
NaN |
63761.5 |
NaN |
NaN |
NaN |
174 |
50% |
NaN |
83532 |
NaN |
NaN |
NaN |
174 |
75% |
NaN |
115178.5 |
NaN |
NaN |
NaN |
198 |
max |
NaN |
224697 |
NaN |
NaN |
NaN |
249 |
Distribution des données
format
- Le format Attapon ferme environ les deux tiers
- Carnaval seulement 3 fois
format |
Le nombre de données |
Carnival |
3 |
Groove |
32 |
Attapon |
60 |
attribut
- Le format de données est Groove uniquement
- Tenu assez uniformément
attribut |
Le nombre de données |
Da |
10 |
Vi |
11 |
Vo |
11 |
2001e frontière
- Toutes les données
- Ourlet long à droite

- Code couleur par format
- Le format du carnaval est moins fréquent, mais les frontières sont plus hautes
- Le format d'attaque a une longue distribution d'ourlet vers la droite
- Groove a deux montagnes

période
- Toutes les données
- Aucune donnée au format Carnaval en raison du manque

Relation entre les variables
Par format
2001e frontière
- Carnaval: omis car il n'y a que 3 données
- Groove: globalement le plus bas. Médias <moyen.
- Attapon: Milieu dans trois formats. Médias <moyen. Il y a une valeur aberrante sur le dessus.
format |
Carnival |
Groove |
Attapon |
count |
3 |
32 |
60 |
mean |
188751.7 |
87048.6 |
94924.4 |
std |
19012.5 |
35318.9 |
42349.2 |
min |
176743 |
40096 |
42944 |
25% |
177791.5 |
52942.5 |
67515.8 |
50% |
178840 |
84560 |
80589.5 |
75% |
194756 |
114458 |
112983 |
max |
210672 |
170014 |
224697 |

période
- Carnaval: aucune donnée
- Rainure: 174 pour la moitié inférieure et supérieure
- Attapon: min est plus petit que Groove et max est plus grand que Groove. Il y a une valeur aberrante sur le dessus
format |
Carnival |
Groove |
Attapon |
count |
0 |
32 |
60 |
mean |
NaN |
188.3 |
181.0 |
std |
NaN |
18.1 |
19.3 |
min |
NaN |
174 |
150 |
25% |
NaN |
174 |
174 |
50% |
NaN |
174 |
174 |
75% |
NaN |
198 |
198 |
max |
NaN |
222 |
249 |

Pour chaque attribut
- Le format de données est Groove uniquement
- 2001ème frontière
- Da: moyenne, médiane, minimum, maximum sont tous les plus bas
- Vi: Moyenne / minimum / maximum est le plus élevé
- Vo: médiane la plus élevée
attribut |
Da |
Vi |
Vo |
count |
10 |
11 |
11 |
mean |
81120.2 |
92813.3 |
86673.3 |
std |
32024.0 |
38595.9 |
37182.3 |
min |
40096 |
46300 |
42544 |
25% |
54767.3 |
64639.5 |
49871 |
50% |
78106.5 |
82143 |
100476 |
75% |
110899.3 |
110700 |
118864.5 |
max |
127482 |
170014 |
140000 |

période
- Matrice de corrélation: semble non corrélée
- Je pense que la relation limite n'est pas nulle car on peut gagner des points si la période est longue, mais il semble que d'autres facteurs soient plus forts.
|
2001e |
période |
2001e |
1.0 |
-0.126 |
période |
-0.126 |
1.0 |

Date
2001e frontière


période
- Les premiers événements ont dépassé 200h, mais récemment, ils ont été fixés à 160h ~ 200h

Sommaire
- format
- Si vous voulez creuser profondément, il semble préférable de commencer par l'attaquant avec la plus grande quantité de données.
- Carnival a une petite quantité de données, donc l'analyse est difficile
- Période
- Je pensais que plus la période était longue, plus la frontière était haute, mais ce n'était pas le cas
- Je ne pense pas que la relation soit nulle, mais d'autres facteurs peuvent être plus forts.
- Date
- En tant que tendance, il semble augmenter progressivement
- Les facteurs qui viennent à l'esprit sont les suivants
- Le nombre de joueurs a augmenté et la bataille est devenue féroce
- Il est plus facile de gagner des points
- Le nombre de personnages a augmenté (comme l'inflation des capacités et le nombre de personnes qui peuvent être laissées sans surveillance)
- La grande performance en direct a amélioré l'efficacité du temps
- Autres facteurs possibles
- Variations pour chaque événement
- Idoles de récompense de classement d'événements populaires