[PYTHON] [Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.4. Unüberwachte Dimensionsreduzierung

google übersetzte http://scikit-learn.org/0.18/modules/unsupervised_reduction.html [scikit-learn 0.18 Benutzerhandbuch 4. Datensatzkonvertierung](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF Von% E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B)


4.4 Unbeaufsichtigte Dimensionsreduzierung

Wenn die Merkmalsmenge eine große Anzahl von Dimensionen aufweist, ist es nützlich, sie im unbeaufsichtigten Schritt vor dem überwachten Schritt zu reduzieren. [Lernmethode ohne Lehrer](http://qiita.com/nazoking@github/items/267f2371757516f8c168#2-%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97% Viele von E5% AD% A6% E7% BF% 92) implementieren "Transformations" -Methoden, mit denen Dimensionen reduziert werden können. Im Folgenden werden zwei spezifische Beispiele für dieses häufig verwendete Muster beschrieben.

4.4.1 PCA: Hauptkomponentenanalyse

decomposition.PCA ist eine Merkmalsmenge, die die Streuung der ursprünglichen Merkmalsmenge gut erfasst. Suchen Sie nach einer Kombination von. Siehe Zerlegen von Komponentensignalen (Matrixzerlegungsproblem) (http://scikit-learn.org/0.18/modules/decomposition.html#decompositions).

4.4.2. Zufällige Projektion

Modul: random_projection bietet verschiedene Tools zur Datenreduktion mit zufälliger Projektion. Siehe den entsprechenden Abschnitt der Dokumentation: Zufällige Projektion (http://qiita.com/nazoking@github/items/16f65bbcfda517a74df2).

4.4.3. Funktionsakkumulation

cluster.FeatureAgglomeration ist [Hierarchical Clustering](http: // scikit- Wenden Sie learn.org/0.18/modules/clustering.html#hierarchical-clustering) an, um Features zu gruppieren, die sich ähnlich verhalten.

** Feature-Skalierung **

Wenn die Skalierung der Merkmale oder die statistischen Eigenschaften sehr unterschiedlich sind, wählen Sie cluster.FeatureAgglomeration (http://scikit-learn.org/0.18/modules/generated/sklearn.cluster.FeatureAgglomeration.html#sklearn.cluster.FeatureAgglomeration). Beachten Sie, dass Sie möglicherweise keine Verknüpfungen zwischen verwandten Feature-Mengen erhalten können. In diesen Umgebungen können Sie preprocessing.StandardScaler verwenden.


[scikit-learn 0.18 Benutzerhandbuch 4. Datensatzkonvertierung](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF Von% E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B) © 2010 - 2016, Entwickler von Scikit-Learn (BSD-Lizenz).

Recommended Posts

[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.4. Unüberwachte Dimensionsreduzierung
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.5. Zufällige Projektion
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.11. Ensemble-Methode
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.15. Isotonische Regression
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.2 Merkmalsextraktion
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.16. Wahrscheinlichkeitskalibrierung
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.13 Funktionsauswahl
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 3.4. Modellpersistenz
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 2.8. Dichteschätzung
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.3. Datenvorverarbeitung
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch Inhaltsverzeichnis
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.4. Support Vector Machine
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 1.12. Mehrklassenalgorithmus und Mehrfachetikettenalgorithmus
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 3.2. Optimieren der Hyperparameter des Schätzers
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.8. Konvertieren Sie das Vorhersageziel (y)
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 2.7. Erkennung von Neuheiten und Ausreißern
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 3.1. Kreuzvalidierung: Bewerten Sie die Leistung des Schätzers
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 3.3. Modellbewertung: Quantifizieren Sie die Qualität der Vorhersage
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 4.1. Pipeline- und Feature-Union: Kombination von Schätzern
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 3.5. Verifizierungskurve: Zeichnen Sie die Punktzahl, um das Modell zu bewerten
[Übersetzung] scikit-learn 0.18 Benutzerhandbuch 2.5. Zerlegen von Signalen in Komponenten (Matrixzerlegungsproblem)
Pandas Benutzerhandbuch "Multi-Index / Advanced Index" (offizielles Dokument Japanische Übersetzung)
Pandas Benutzerhandbuch "Manipulieren fehlender Daten" (offizielles Dokument Japanische Übersetzung)