[PYTHON] Betreutes Lernen (Klassifizierung)
Einstufung
Ich schreibe als Memo, das ich hauptsächlich mit Aidemy über die Klassifizierung des überwachten Lernens studiert habe.
Methode
▼ Logistische Rückgabe
■ Übersicht
--Finden und klassifizieren Sie die Grenzen linear trennbarer Daten durch Training
■ Funktionen
- Die Grenze wird zu einer geraden Linie
- Wird für Daten mit wenigen Klassen verwendet, z. B. für die binäre Klassifizierung
- Die Wahrscheinlichkeit, dass die Daten in Klassen eingeteilt werden, kann berechnet werden (Niederschlagswahrscheinlichkeit usw.)
■ Nachteile
- Kann nicht klassifiziert werden, es sei denn, linear trennbar
- Nicht für hochdimensionale, spärliche Daten geeignet
- Die Grenze ist nicht vielseitig (gezogen durch Trainingsdaten)
■ Importmethode
from sklearn.linear_model import LogisticRegression
--scikit-learn Bibliothek
--linear_module Submodul
--LogisticRegression () Funktion
▼ Lineare SVM
■ Übersicht
- Durch Datengrenzen klassifiziert
--SVM zum Klassifizieren durch Zeichnen einer geraden Linie
■ Funktionen
--Unterstützungsvektor (Datengruppe in der Nähe anderer Klassen)
- Zeichnen Sie einen Rand an der Stelle, an der der Abstand zum Stützvektor am größten ist
- Einfache Verallgemeinerung und Verbesserung der Vorhersage der Datenklassifizierung
- Einfach, eine Linie zu machen
■ Nachteile
――Vorhersagen sind mit zunehmender Datenmenge in der Regel langsam
- Kann nicht klassifiziert werden, es sei denn, linear trennbar
■ Importmethode
from sklearn.svm import LinearSVC