[PYTHON] Ich habe kurz zusammengefasst, was Sie beim Lernen mit / ohne Lehrer beachten sollten

Als Memorandum werde ich die Gliederung, Klassen, Beispiele, zu verwendenden Schlüsselwörter und Websites zusammenfassen, die beim Erlernen von "Lernen mit Lehrer" und "Lernen ohne Lehrer" hilfreich waren.

"Lernen mit dem Lehrer"

Mecha Zackli: Erstellen Sie ein Vorhersagemodell, indem Sie ein Training geben, das die Merkmale und die entsprechenden Antwortdaten darstellt. Es gibt Klassifizierungsprobleme und Regressionsprobleme bei der Vorhersage.

Jede Methode

① Lineare Regression

Suchen Sie den Parameter mit dem kleinsten Wert für die Verlustfunktion (Fehlerfunktion) unter allen Geraden.

② Logistische Rendite

Es ist ein binärer Klassifizierungsalgorithmus und wird auf Klassifizierungsprobleme angewendet.

③ SVM (linear)

Ein Algorithmus, der die Entscheidungsgrenze (gerade Linie) von den Daten entfernt lernt und sowohl für die Klassifizierung als auch für die Regression verwendet werden kann.

④ SVM (Kernel-Methode)

Der Datensatz wird getrennt, nachdem die Realraumdaten einem Raum zugeordnet wurden, der durch eine Superebene durch eine Kernelfunktion getrennt werden kann.

⑤ Naive Buchten

Unter der Annahme, dass jede Merkmalsmenge unabhängig ist, wird die Wahrscheinlichkeit berechnet, dass die Daten eine Bezeichnung sind.

⑥ Zufälliger Wald

Sammeln Sie die Ergebnisse mehrerer Entscheidungsbäume mit Vielfalt und erstellen Sie Klassifizierungsergebnisse durch Mehrheitsentscheidung.

⑦ Neuronales Netz

Lernen Sie komplexe Entscheidungsgrenzen, indem Sie eine Zwischenschicht zwischen Ein- und Ausgängen einfügen.

⑧ k Nachbarschaftsmethode

Die Beurteilung erfolgt durch Mehrheitsentscheidung von k Klassifikationen in der Nähe der Eingabedaten.

Bewertungsmethoden

Referenzseite: Mit scikit-learn eine Verwirrungsmatrix erstellen, Präzisionsrate, Rückrufrate, F1-Wert usw. berechnen Berechnen Sie die ROC-Kurve und ihre AUC mit scicit-learn

--b-3. Entscheidungskoeffizient
Zu verwendende Klasse: sklearn.metrics.r2_score
Referenzseite: Ergebnis des Regressionsmodells mit scikit-learn auswerten / scikit-learn /% E5% 9B% 9E% E5% B8% B0% E3% 83% A2% E3% 83% 87% E3% 83% AB% E3% 81% AE% E8% A9% 95% E4% BE% A1) So verhindern Sie Überlernen - ** a. Hyperparameter ** --a-1. Rastersuche
Zu verwendende Klasse: sklearn.grid_search.GridSearchCV --a-2. Zufällige Suche
Zu verwendende Klasse: sklearn.grid_search.RandomizedSearchCV

Referenzseite: Lassen Sie uns die Hyperparameter des Modells mit scicit-learn abstimmen!

Referenzseite: [Informationen zur Aufteilung von Lerndaten und Testdaten beim maschinellen Lernen und beim Tiefenlernen](https://newtechnologylifestyle.net/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7 % BF% 92% E3% 80% 81% E3% 83% 87% E3% 82% A3% E3% 83% BC% E3% 83% 97% E3% 83% A9% E3% 83% BC% E3% 83 % 8B% E3% 83% B3% E3% 82% B0% E3% 81% A7% E3% 81% AE% E5% AD% A6% E7% BF% 92% E3% 83% 87% E3% 83% BC % E3% 82% BF% E3% 81% A8 /)

Referenzseite: Erklärung der Gratregression und Lasso-Regression in kürzester Zeit (Erlernen des maschinellen Lernens Nr. 3)

"Lernen ohne Lehrer"

Mecha Zackri: Im Gegensatz zu überwachtem Lernen gibt es keine objektive Variable. Hier wird die Struktur der Merkmalsdaten extrahiert, indem sie in eine andere Form umgewandelt oder eine Teilmenge gefunden werden. Zu den Techniken gehören Dimensionsreduzierung und Clustering.

① Hauptkomponentenanalyse (PCA)

Fassen Sie eine große Anzahl quantitativer erklärender Variablen in weniger Indikatoren und synthetischen Variablen zusammen, um die Variablen in den Daten zu reduzieren.

② K-Durchschnittsmethode (K-Mittel-Methode)

Klassifizieren Sie die Daten in eine bestimmte Anzahl von Clustern und teilen Sie ähnliche in Gruppen ein.

③ Latente Bedeutungsanalyse (LSA)

In Satzdaten wird die Ähnlichkeit zwischen Wörtern und Sätzen erhalten, indem die Merkmalsmenge von der Anzahl der Wörter auf die Anzahl der latenten Themen reduziert wird.

④ Nicht-negative Matrixfaktor-Zersetzung (NMF)

Eine Dimensionsreduktionsmethode mit der Eigenschaft, dass alle Eingabe- und Ausgabedatenwerte nicht negativ sind.

⑤ Potenzielle Richtungszuweisungsmethode (LDA)

Erstellen Sie ein Thema aus den Wörtern im Dokument und fragen Sie, aus welchem Thema das Dokument besteht.

⑥ Gemischte Gaußsche Verteilung (GMM)

Das Clustering erfolgt durch lineare Verbindung mehrerer Gaußscher Verteilungen.

⑦ Lokale lineare Einbettung (LLE)

Die Dimensionsreduzierung wird für nichtlineare Daten durchgeführt.

Nicht verteilte stochastische Nachbarschafts-Einbettungsmethode (t-SNE)

Es ist eine Methode zum Reduzieren hochdimensionaler Daten auf zwei oder drei Dimensionen und wird zur Datenvisualisierung verwendet.

Recommended Posts

Ich habe kurz zusammengefasst, was Sie beim Lernen mit / ohne Lehrer beachten sollten
Was soll ich mit DICOM von MPEG2 machen?
Vorsichtsmaßnahmen bei der Verwendung von Python mit AtCoder
Dinge, die Sie bei der Verwendung von CGI mit Python beachten sollten.
Beachten Sie Folgendes, wenn Sie mit ndarray einen Zeilenvektor in einen Spaltenvektor konvertieren
Ich habe beim Clustering mit k-means versagt, aber was soll ich tun (Implementierung des Kernels k-means)
Was ich getan habe, als ich mit Lambda Python im Zeitlimit steckte
Verwenden Sie den Welch-T-Test (sollte) mit oder ohne gleiche Dispersion
[Frage] Was passiert, wenn Sie% in Python verwenden?
Was verwenden Sie beim Testen mit Python?
Was ich getan habe, als ich wütend war, es mit der Option enable-shared einzufügen