Dieses Mal wird es das Herzstück des maschinellen Lernens sein Ich werde über Scikit-Learn posten.
Lesen Sie als Cykit Learn. Python-Bibliothek für maschinelles Lernen.
Informationen zu der Analyse (Klassifizierung, Regression usw.), die Sie durchführen möchten Ein Spickzettel, mit dem Sie einfach ein Modell auswählen können.
Bestimmen Sie, zu welcher Klasse es gehört.
SGD(stochastic gradient descent) Für mehr als 100.000 Daten Lineare Klassifizierungsmethode
Für mehr als 100.000 Daten Wenn SGD nicht funktioniert Nichtlineare Klassifizierungsmethode
Linear SVC Für weniger als 100.000 Lineare Klassifizierungsmethode
Für weniger als 100.000 Wenn der lineare SVC nicht funktioniert Dies ist eine nichtlineare Klassifizierungsmethode.
Für Textdaten
Vorhersage des Zielwertes
SGD(stochastic gradient descent) Für mehr als 100.000 Daten Lineare Regressionsanalysemethode
LASSO、ElasticNet Für weniger als 100.000 Wenn einige der erklärenden Variablen wichtig sind Regressive Analysemethode
Ridge、Liner SVR Für weniger als 100.000 Wenn alle erklärenden Variablen wichtig sind Regressive Analysemethode
Wenn Ridge oder Liner SVR nicht funktioniert Nichtlineare Regressionsanalysemethode
Dinge nach einigen Regeln zu teilen
KMeans Wann kann im Voraus entschieden werden, in wie viele Cluster unterteilt werden soll? Clustering-Analysemethode
MiniBatch Für mehr als 100.000 Daten Methode zum Lernen beim Teilen von Daten
Wenn KMeans nicht funktioniert Nichtlineare Clusteranalyse-Methode.
MeanShift、VBGMM Wenn es nicht möglich ist, im Voraus zu entscheiden, wie viele Cluster geteilt werden sollen Es ist eine Clusteranalyse-Methode.
Im Vorbehandlungsprozess Wir werden es tun, um die Lerneffizienz zu verbessern
PCA, Kernel-PCA, Isomap, Spectral Embedding usw.
Anpassungswerte wie Lernmethoden werden als "Hyperparameter" bezeichnet.
Es gibt Methoden wie Rastersuche und Kreuzvalidierung.
Recommended Posts