[PYTHON] Apprentissage supervisé (classification)
Classification
J'écris comme mémo que j'ai principalement étudié avec Aidemy sur la classification des apprentissages supervisés.
Méthode
▼ Retour logistique
■ Aperçu
--Trouvez et classez les limites des données linéairement séparables par entraînement
■ Caractéristiques
--La frontière devient une ligne droite
- Utilisé pour les données avec peu de classes telles que la classification binaire
--La probabilité que les données soient classées en classes peut être calculée (probabilité de précipitations, etc.)
■ Inconvénients
--Ne peut pas être classé sauf s'il est séparable linéairement
- Ne convient pas aux données éparses de grande dimension
--La limite n'est pas polyvalente (tirée par les données d'entraînement)
■ Méthode d'importation
from sklearn.linear_model import LogisticRegression
- bibliothèque scikit-learn
Sous-module --linear_module
--FonctionLogisticRegression ()
▼ SVM linéaire
■ Aperçu
--Classifié par limites de données
--SVM pour classer en traçant une ligne droite
■ Caractéristiques
--Vecteur de support (groupe de données proche des autres classes)
- Tracez une bordure à la position où la distance du vecteur de support est la plus grande
--Facile à généraliser et à améliorer la prédiction de classification des données
--Facile à faire une ligne
■ Inconvénients
――La prévision a tendance à être lente à mesure que la quantité de données augmente
--Ne peut être classé que s'il est séparable
■ Méthode d'importation
from sklearn.svm import LinearSVC