[PYTHON] [Français] scikit-learn 0.18 Guide de l'utilisateur 4.4. Réduction de dimension non supervisée

google traduit http://scikit-learn.org/0.18/modules/unsupervised_reduction.html [scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B)


4.4. Réduction de dimension non supervisée

Si la quantité de caractéristiques a un grand nombre de dimensions, il est utile de la réduire dans l'étape non supervisée avant l'étape supervisée. [Méthode d'apprentissage sans enseignant](http://qiita.com/nazoking@github/items/267f2371757516f8c168#2-%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97% Beaucoup de E5% AD% A6% E7% BF% 92) implémentent des méthodes de «transformation» qui peuvent être utilisées pour réduire les dimensions. Ce qui suit décrit deux exemples spécifiques de ce modèle fréquemment utilisé.

4.4.1. ACP: analyse en composantes principales

decomposition.PCA est une quantité de caractéristiques qui capture bien la dispersion de la quantité de caractéristiques d'origine. Recherchez une combinaison de. Voir Décomposition des signaux des composants (problème de décomposition de la matrice) (http://scikit-learn.org/0.18/modules/decomposition.html#decompositions).

4.4.2. Projection aléatoire

Module: random_projection fournit plusieurs outils de réduction des données avec projection aléatoire. Voir la section appropriée de la documentation: Projection aléatoire (http://qiita.com/nazoking@github/items/16f65bbcfda517a74df2).

4.4.3. Accumulation de fonctionnalités

cluster.FeatureAgglomeration est [Hierarchical Clustering](http: // scikit- Appliquez learn.org/0.18/modules/clustering.html#hierarchical-clustering) pour regrouper les fonctionnalités qui se comportent de manière similaire.

** Mise à l'échelle des fonctionnalités **

Si la mise à l'échelle des fonctionnalités ou les propriétés statistiques sont très différentes, alors cluster.FeatureAgglomeration (http://scikit-learn.org/0.18/modules/generated/sklearn.cluster.FeatureAgglomeration.html#sklearn.cluster.FeatureAgglomeration) Notez que vous ne pourrez peut-être pas obtenir de liens entre les quantités d'entités associées. Dans ces environnements, vous pouvez utiliser preprocessing.StandardScaler.


[scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B) © 2010 --2016, développeurs scikit-learn (licence BSD).

Recommended Posts

[Français] scikit-learn 0.18 Guide de l'utilisateur 4.4. Réduction de dimension non supervisée
[Français] scikit-learn 0.18 Guide de l'utilisateur 4.5. Projection aléatoire
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.11. Méthode Ensemble
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.15. Régression isotonique
[Français] scikit-learn 0.18 Guide de l'utilisateur 4.2 Extraction de fonctionnalités
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.16. Étalonnage des probabilités
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.13 Sélection des fonctionnalités
[Français] scikit-learn 0.18 Guide de l'utilisateur 3.4. Persistance du modèle
[Français] scikit-learn 0.18 Guide de l'utilisateur 2.8. Estimation de la densité
[Français] scikit-learn 0.18 Guide de l'utilisateur 4.3. Prétraitement des données
[Français] scikit-learn 0.18 Guide de l'utilisateur Table des matières
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.4. Support Vector Machine
[Français] scikit-learn 0.18 Guide de l'utilisateur 1.12. Algorithme multi-classes et algorithme multi-étiquettes
[Français] scikit-learn 0.18 Guide de l'utilisateur 3.2. Réglage des hyper paramètres de l'estimateur
[Français] scikit-learn 0.18 Guide de l'utilisateur 4.8. Convertir la cible de prédiction (y)
[Français] scikit-learn 0.18 Guide de l'utilisateur 2.7. Détection des nouveautés et des valeurs aberrantes
[Français] scikit-learn 0.18 Guide de l'utilisateur 3.1. Validation croisée: évaluer les performances de l'estimateur
[Français] scikit-learn 0.18 Guide de l'utilisateur 3.3. Évaluation du modèle: quantifier la qualité de la prédiction
[Français] scikit-learn 0.18 Guide de l'utilisateur 4.1. Union des pipelines et des fonctionnalités: combinaison d'estimateurs
[Français] scikit-learn 0.18 Guide de l'utilisateur 3.5. Courbe de vérification: tracez le score pour évaluer le modèle
[Français] scikit-learn 0.18 Guide de l'utilisateur 2.5. Décomposer les signaux en composants (problème de décomposition de la matrice)
Guide de l'utilisateur Pandas "Multi-Index / Advanced Index" (Document officiel traduction japonaise)
Guide de l'utilisateur Pandas "Manipulation des données manquantes" (Document officiel de traduction en japonais)