Als Memorandum werde ich die Gliederung, Klassen, Beispiele, zu verwendenden Schlüsselwörter und Websites zusammenfassen, die beim Erlernen von "Lernen mit Lehrer" und "Lernen ohne Lehrer" hilfreich waren.
Mecha Zackli: Erstellen Sie ein Vorhersagemodell, indem Sie ein Training geben, das die Merkmale und die entsprechenden Antwortdaten darstellt. Es gibt Klassifizierungsprobleme und Regressionsprobleme bei der Vorhersage.
Suchen Sie den Parameter mit dem kleinsten Wert für die Verlustfunktion (Fehlerfunktion) unter allen Geraden.
sklearn.linear_model.LinearRegression
--Beispiel: Beziehung zwischen Besucherzahl und Umsatz usw.Es ist ein binärer Klassifizierungsalgorithmus und wird auf Klassifizierungsprobleme angewendet.
sklearn.linear_model.LogisticRegression
--Beispiel: Beziehung zwischen Verkaufsbesuchen / Zufriedenheit und Verkauf usw.Ein Algorithmus, der die Entscheidungsgrenze (gerade Linie) von den Daten entfernt lernt und sowohl für die Klassifizierung als auch für die Regression verwendet werden kann.
sklearn.svm.SVC
Der Datensatz wird getrennt, nachdem die Realraumdaten einem Raum zugeordnet wurden, der durch eine Superebene durch eine Kernelfunktion getrennt werden kann.
sklearn.svm.SVC
Unter der Annahme, dass jede Merkmalsmenge unabhängig ist, wird die Wahrscheinlichkeit berechnet, dass die Daten eine Bezeichnung sind.
sklearn.naive_bayes.MultinomialNB (Andere GaussianNB, GaussianNB usw.)
Sammeln Sie die Ergebnisse mehrerer Entscheidungsbäume mit Vielfalt und erstellen Sie Klassifizierungsergebnisse durch Mehrheitsentscheidung.
sklearn.ensemble.RandomForestClassifier
--Case: Klassifizierung nach Aktionsverlauf und AttributenLernen Sie komplexe Entscheidungsgrenzen, indem Sie eine Zwischenschicht zwischen Ein- und Ausgängen einfügen.
sklearn.neural_network.MLPClassifier
Die Beurteilung erfolgt durch Mehrheitsentscheidung von k Klassifikationen in der Nähe der Eingabedaten.
sklearn.neighbors.KNeighborsClassifier
sklearn.metrics.confusion_matrix
--a-2. Richtige Antwortrate sklearn.metrics.accuracy_score
--a-3. Konformitätsrate sklearn.metrics.precision_score
--a-4. Rückrufrate sklearn.metrics.recall_score
--a-5. F-Wert sklearn.metrics.f1_score
sklearn.metrics.roc_curve
Referenzseite: Mit scikit-learn eine Verwirrungsmatrix erstellen, Präzisionsrate, Rückrufrate, F1-Wert usw. berechnen Berechnen Sie die ROC-Kurve und ihre AUC mit scicit-learn
sklearn.metrics.mean_squared_error
--b-2. Durchschnittlicher absoluter Fehler --b-3. Entscheidungskoeffizient
Zu verwendende Klasse: sklearn.metrics.r2_score
Referenzseite: Ergebnis des Regressionsmodells mit scikit-learn auswerten / scikit-learn /% E5% 9B% 9E% E5% B8% B0% E3% 83% A2% E3% 83% 87% E3% 83% AB% E3% 81% AE% E8% A9% 95% E4% BE% A1) So verhindern Sie Überlernen - ** a. Hyperparameter ** --a-1. Rastersuche
Zu verwendende Klasse: sklearn.grid_search.GridSearchCV
--a-2. Zufällige Suche
Zu verwendende Klasse: sklearn.grid_search.RandomizedSearchCV
Referenzseite: Lassen Sie uns die Hyperparameter des Modells mit scicit-learn abstimmen!
sklearn.model_selection.train_test_split
--b-2. Kreuzvalidierungsmethode sklearn.model_selection.cross_val_score`` sklearn.model_selection.KFold
--b-3. Lassen Sie die einmalige Methode sklearn.model_selection.LeaveOneOut
Referenzseite: [Informationen zur Aufteilung von Lerndaten und Testdaten beim maschinellen Lernen und beim Tiefenlernen](https://newtechnologylifestyle.net/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7 % BF% 92% E3% 80% 81% E3% 83% 87% E3% 82% A3% E3% 83% BC% E3% 83% 97% E3% 83% A9% E3% 83% BC% E3% 83 % 8B% E3% 83% B3% E3% 82% B0% E3% 81% A7% E3% 81% AE% E5% AD% A6% E7% BF% 92% E3% 83% 87% E3% 83% BC % E3% 82% BF% E3% 81% A8 /)
sklearn.linear_model.Ridge
--c-2. Rückkehr nach Rosso sklearn.linear_model.Lasso
Referenzseite: Erklärung der Gratregression und Lasso-Regression in kürzester Zeit (Erlernen des maschinellen Lernens Nr. 3)
Mecha Zackri: Im Gegensatz zu überwachtem Lernen gibt es keine objektive Variable. Hier wird die Struktur der Merkmalsdaten extrahiert, indem sie in eine andere Form umgewandelt oder eine Teilmenge gefunden werden. Zu den Techniken gehören Dimensionsreduzierung und Clustering.
Fassen Sie eine große Anzahl quantitativer erklärender Variablen in weniger Indikatoren und synthetischen Variablen zusammen, um die Variablen in den Daten zu reduzieren.
sklearn.decomposition.PCA
Klassifizieren Sie die Daten in eine bestimmte Anzahl von Clustern und teilen Sie ähnliche in Gruppen ein.
sklearn.cluster.KMeans
In Satzdaten wird die Ähnlichkeit zwischen Wörtern und Sätzen erhalten, indem die Merkmalsmenge von der Anzahl der Wörter auf die Anzahl der latenten Themen reduziert wird.
sklearn.decomposition.TruncatedSVD
Eine Dimensionsreduktionsmethode mit der Eigenschaft, dass alle Eingabe- und Ausgabedatenwerte nicht negativ sind.
sklearn.decomposition.NMF
--Fall: Empfehlung, Text Mining
--Referenzseite: Nicht-negative Matrixfaktor-Zerlegung (NMF) sanft verstehenErstellen Sie ein Thema aus den Wörtern im Dokument und fragen Sie, aus welchem Thema das Dokument besteht.
sklearn.decomposition.LatentDirichletAllocation
Das Clustering erfolgt durch lineare Verbindung mehrerer Gaußscher Verteilungen.
sklearn.mixture.GaussianMixture
Die Dimensionsreduzierung wird für nichtlineare Daten durchgeführt.
sklearn.manifold.LocallyLinearEmbedding
Es ist eine Methode zum Reduzieren hochdimensionaler Daten auf zwei oder drei Dimensionen und wird zur Datenvisualisierung verwendet.
sklearn.manifold.TSNE
Recommended Posts