[PYTHON] Statistiques prédictives (théorie)

N'hésitez pas à commenter car cela peut être erroné en tant que résultat de l'étude. Cette fois, j'écrirai sur la prédiction.

Contenu

・ Qu'est-ce que la prédiction? ・ Type variable ・ Méthode de prédiction ・ À propos des données

Que prévoir

Il s'agit de prédire si le graphique après un certain temps augmentera ou diminuera à partir des informations du graphique avant un certain temps, ou de prédire comment le classer avec une certaine étiquette.

variable

Il existe deux variables principales utilisées dans la prédiction. ・ Variable objectif · Variables explicatives

Variable objectif

La variable objectif est la cible des données à traiter. Par exemple, lorsqu'on regarde les ventes de produits, le nombre de produits lui-même est la variable objective.

Variable explicative

Les variables explicatives sont des événements qui affectent la variable objective. Par exemple, les ventes de pommes peuvent baisser ou augmenter en raison des conditions météorologiques, de la demande des consommateurs et des problèmes sociaux modernes. Les variables explicatives sont ces événements.

Méthode de prédiction

Il existe les deux méthodes suivantes pour effectuer des prédictions. · Revenir · Classification

Revenir

Cela fait une prédiction graphique pour les valeurs numériques. Par exemple, la prévision de la demande pour les produits mentionnés dans l'exemple précédent.

Classification

Il s'agit d'une méthode de division par catégorie. Par exemple, nous prévoyons que nous diviserons les lions et les guépards dans la catégorie des chats.

À propos des données

Les données sont couramment utilisées au quotidien, mais elles sont bien structurées dans le monde de la science des données. Ce sont les deux suivants. · Entraînement ・ Évaluation (test)

Apprentissage

Créer un modèle basé sur les données

Évaluation

Comparaison du modèle appris avec les données d'évaluation d'origine

* Remarques </ b> Une chose à garder à l'esprit lors de la construction d'un modèle est d'éviter le surentraînement </ b>. Le surentraînement signifie que vous ne pouvez pas prévoir de manière flexible parce que vous mettez trop de données spécifiques. Par exemple, lorsque vous entrez des données indiquant que tout le monde aime les pommes dans une école de cram avec 100 élèves, la machine prédit que d'autres personnes aimeront également les pommes avec 100% de chances. Cependant, dans une autre école, seulement la moitié ou moins des élèves aiment les pommes. À ce stade, la prédiction n'est pas de 100%. C'est du surapprentissage. Par conséquent, la quantité de données à apprendre pour éviter cela doit être ajustée.

Recommended Posts