[PYTHON] [Français] didacticiel scikit-learn 0.18 Didacticiel d'apprentissage statistique pour le traitement des données scientifiques Apprentissage statistique: paramètres et objets d'estimation dans scikit-learn

traduction google de http://scikit-learn.org/0.18/tutorial/statistical_inference/settings.html Table des matières du didacticiel scikit-learn 0.18 Tableau du didacticiel d'apprentissage statistique pour le traitement des données scientifiques


Apprentissage statistique: paramètres et objets d'estimation dans scikit-learn

base de données

scikit-learn traite de l'apprentissage des informations d'un ou plusieurs jeux de données représentés sous forme de tableau à deux dimensions. Ils peuvent être compris comme une liste d'observations multidimensionnelles. Le premier axe de ces séquences est l'axe d'échantillonnage et le second axe est l'axe élémentaire.

** scikit: un exemple simple livré avec l'ensemble de données iris **

>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> data = iris.data
>>> data.shape
(150, 4)

Il consiste en des observations de 150 iris. Chaque caractéristique est la longueur et la largeur de ses feuilles et pétales, comme détaillé dans ʻiris.DESCR`.

Si les données ne sont pas sous la forme (n_samples, n_features), elles doivent être prétraitées pour être utilisées avec scicit-learn.

** Un exemple de reformage de données est le jeu de données chiffres **

L'ensemble de données de chiffres se compose de 1797 images 8x8 de nombres manuscrits.

>>> digits = datasets.load_digits()
>>> digits.images.shape
(1797, 8, 8)
>>> import matplotlib.pyplot as plt 
>>> plt.imshow(digits.images[-1], cmap=plt.cm.gray_r) 
<matplotlib.image.AxesImage object at ...>

Convertissez chaque image 8x8 en un vecteur d'entités de longueur 64 à utiliser avec cet ensemble de données dans scikit

>>> data = digits.images.reshape((digits.images.shape[0], -1))

Objet Estimator

** Fitting data: ** La principale API implémentée par scikit-learn est l'API Estimator. Un estimateur est un objet qui apprend des données. Il peut s'agir d'un classificateur, d'un algorithme de régression ou de clustering, ou d'un convertisseur qui extrait / filtre des fonctionnalités utiles à partir des données brutes. Tous les objets estimateurs exposent une méthode fit qui prend un ensemble de données (généralement un tableau à deux dimensions) comme argument.

>>> estimator.fit(data)

** Paramètres de l'estimateur: ** Tous les paramètres de l'estimateur peuvent être définis lorsqu'ils sont instanciés ou en modifiant les attributs correspondants.

>>> estimator = Estimator(param1=1, param2=2)
>>> estimator.param1
1

** Paramètres estimés: ** Lorsque l'estimateur est fait pour "ajuster" les données, les paramètres sont estimés à partir des données disponibles. Tous les paramètres d'estimation sont des attributs de l'objet estimateur qui se terminent par un trait de soulignement.

>>> estimator.estimated_pa​​ram_

Page suivante du didacticiel

Tableau du didacticiel d'apprentissage statistique pour le traitement des données scientifiques

© 2010 --2016, développeurs scikit-learn (licence BSD).

Recommended Posts

[Français] didacticiel scikit-learn 0.18 Didacticiel d'apprentissage statistique pour le traitement des données scientifiques Apprentissage statistique: paramètres et objets d'estimation dans scikit-learn
[Français] Tutoriel scikit-learn 0.18 Tutoriel d'apprentissage statistique pour le traitement des données scientifiques
[Français] scikit-learn 0.18 Tutorial Tutoriel d'apprentissage statistique pour le traitement des données scientifiques Sélection du modèle: sélection de l'estimateur et de ses paramètres
[Français] didacticiel scikit-learn 0.18 Didacticiel d'apprentissage statistique pour le traitement des données scientifiques Mettre le tout ensemble
[Français] scikit-learn 0.18 Tutorial Rechercher de l'aide pour des tutoriels d'apprentissage statistique pour le traitement des données scientifiques
[Français] didacticiel scikit-learn 0.18 Didacticiel d'apprentissage statistique pour le traitement des données scientifiques Apprentissage non supervisé: recherche de représentation des données
[Français] didacticiel scikit-learn 0.18 Didacticiel d'apprentissage statistique pour le traitement des données scientifiques Apprentissage supervisé: prédire les variables de sortie à partir d'observations en haute dimension
Organisation des procédures de base pour l'analyse des données et le traitement statistique (4)
Organisation des procédures de base pour l'analyse des données et le traitement statistique (2)
À propos du traitement d'expansion des données pour l'apprentissage en profondeur
[Français] scikit-learn 0.18 Introduction de l'apprentissage automatique par le didacticiel scikit-learn
Traitement pleine largeur et demi-largeur des données CSV en Python
Environ 200 données de latitude et de longitude pour les hôpitaux de Tokyo
Méthodes de traitement des données pour les ingénieurs mécaniciens et les ingénieurs non informaticiens (Introduction 2)
Méthodes de traitement des données pour les ingénieurs mécaniciens et les ingénieurs non informaticiens (Introduction 1)
Notes de lecture (en Python et Stan) pour une introduction à la modélisation statistique pour l'analyse de données (Midorimoto)