google traduit http://scikit-learn.org/0.18/modules/unsupervised_reduction.html [scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B)
Si la quantité de caractéristiques a un grand nombre de dimensions, il est utile de la réduire dans l'étape non supervisée avant l'étape supervisée. [Méthode d'apprentissage sans enseignant](http://qiita.com/nazoking@github/items/267f2371757516f8c168#2-%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97% Beaucoup de E5% AD% A6% E7% BF% 92) implémentent des méthodes de «transformation» qui peuvent être utilisées pour réduire les dimensions. Ce qui suit décrit deux exemples spécifiques de ce modèle fréquemment utilisé.
decomposition.PCA est une quantité de caractéristiques qui capture bien la dispersion de la quantité de caractéristiques d'origine. Recherchez une combinaison de. Voir Décomposition des signaux des composants (problème de décomposition de la matrice) (http://scikit-learn.org/0.18/modules/decomposition.html#decompositions).
Module: random_projection fournit plusieurs outils de réduction des données avec projection aléatoire. Voir la section appropriée de la documentation: Projection aléatoire (http://qiita.com/nazoking@github/items/16f65bbcfda517a74df2).
cluster.FeatureAgglomeration est [Hierarchical Clustering](http: // scikit- Appliquez learn.org/0.18/modules/clustering.html#hierarchical-clustering) pour regrouper les fonctionnalités qui se comportent de manière similaire.
** Mise à l'échelle des fonctionnalités **
Si la mise à l'échelle des fonctionnalités ou les propriétés statistiques sont très différentes, alors cluster.FeatureAgglomeration (http://scikit-learn.org/0.18/modules/generated/sklearn.cluster.FeatureAgglomeration.html#sklearn.cluster.FeatureAgglomeration) Notez que vous ne pourrez peut-être pas obtenir de liens entre les quantités d'entités associées. Dans ces environnements, vous pouvez utiliser preprocessing.StandardScaler.
[scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B) © 2010 --2016, développeurs scikit-learn (licence BSD).
Recommended Posts