[PYTHON] Apprentissage automatique ② Résumé Naive Bayes

Résumé de Naive Bayes

Qu'est-ce que Naive Bays?

Naive Bayes est créé sur la base du théorème bayésien, et est basé sur la probabilité a priori et sa vraisemblance (Explication of likelihood). La probabilité postérieure est calculée et classée dans la catégorie avec la probabilité postérieure la plus élevée. Il est célèbre pour être utilisé pour juger les spams.

Screen Shot 2017-05-08 at 17.58.18.png Extracted from 'Introduction to Machine Learning', Udacity

Ce qui précède est une prédiction naïve des baies de savoir si Sara ou Chris l'ont envoyé à partir du texte de l'e-mail `` LIFE DEAL ''. La probabilité d'envoyer chaque mail de Chris et Sara est de 50% (pré-probabilité) Chris utilise des mots à un taux d'AMOUR 10%, DEAL 80%, LIFE 10%, tandis que Sara utilise des mots à un taux d'AMOUR 30%, DEAL 20% et VIE 30%. (Possibilité)

En d'autres termes, la probabilité postérieure est Pré-probabilité x vraisemblance = post-probabilité Chris 10% × 80% × 50% = 0.04 Sara 30% × 20% × 50% = 0.03

Si vous corrigez cela, 0,04 + 0,03 = 0,07 (c'est 100%) Chris 0.04 / 0.07 = 0.57 → 57% Sara 0.03 / 0.07 = 0.43 → 43%

En d'autres termes, il y a 57% de chances que ce soit Chris, donc le résultat est que l'e-mail qui dit LIFE DEAL Il est classé comme Chris.

code par défaut

python



from sklearn.naive_bayes import GaussianNB

GaussianNB(priors=None)

#C'est le code par défaut, n'est-ce pas?

Les avantages et les inconvénients de NaiveBayes.

Puisque chaque caractéristique est considérée indépendamment et exprimée sur une dimension, la malédiction de la dimensionnalité peut être atténuée.

--Mauvais point

Par exemple, comme vous pouvez le voir dans les premières décisions d'e-mail de Chris et Sara, Naive Bayes ne regarde que la fréquence des mots, donc il ne peut pas déterminer l'ordre ou la combinaison des phrases. Par exemple, en anglais, ajouter simplement pas juste avant un verbe peut changer le sens de 180 degrés. Autrement dit, les quantités de caractéristiques sont considérées comme une quantité de caractéristiques indépendante et la corrélation entre les quantités de caractéristiques n'est pas prise en compte.

Résumé

Ce qui précède est le contour de NaiveBayes pour autant que je puisse comprendre. Nous le mettrons à jour quotidiennement, donc si vous avez quelque chose à ajouter ou à corriger, nous vous serions reconnaissants de bien vouloir commenter.

Recommended Posts

Apprentissage automatique ② Résumé Naive Bayes
Résumé du didacticiel d'apprentissage automatique
Apprentissage automatique ⑤ Résumé AdaBoost
Résumé de l'article sur l'apprentissage automatique (auto-écrit)
Apprentissage automatique ④ Résumé du K-plus proche voisin
Apprentissage automatique
Apprentissage automatique ① Résumé SVM (Support Vector Machine)
Apprentissage automatique ③ Résumé de l'arbre de décision
Les débutants en apprentissage automatique tentent de contacter Naive Bayes (2) - Mise en œuvre
Les débutants en apprentissage automatique tentent de contacter Naive Bayes (1) - Théorie
scikit-learn Comment utiliser le résumé (apprentissage automatique)
Note récapitulative sur la programmation d'apprentissage automatique Python (Jupyter)
Résumé de la classification et de la mise en œuvre des algorithmes d'apprentissage automatique
[Memo] Apprentissage automatique
Classification de l'apprentissage automatique
Algorithme d'apprentissage automatique (résumé de régression linéaire et régularisation)
Exemple d'apprentissage automatique
Résumé des fonctions d'évaluation utilisées dans l'apprentissage automatique
Apprentissage automatique sur le surapprentissage
Apprentissage automatique: supervisé - AdaBoost
Régression logistique d'apprentissage automatique
Machine de vecteur de support d'apprentissage automatique
Étudier l'apprentissage automatique ~ matplotlib ~
Régression linéaire d'apprentissage automatique
Mémo du cours d'apprentissage automatique
Naive Bays (classification multi-classes)
Bibliothèque d'apprentissage automatique dlib
Apprentissage automatique (TensorFlow) + Lotto 6
Apprenez en quelque sorte le machine learning
Résumé de l'apprentissage RAPIDS
Bibliothèque d'apprentissage automatique Shogun
Défi de lapin d'apprentissage automatique
Introduction à l'apprentissage automatique
Apprentissage automatique: k-voisins les plus proches
Qu'est-ce que l'apprentissage automatique?
Résumé des diapositives de la session de lecture ronde de la série professionnelle d'apprentissage automatique
Résumé du site pour apprendre l'apprentissage automatique avec une vidéo en anglais
Résumé du flux de base de l'apprentissage automatique avec Python
Modèle d'apprentissage automatique prenant en compte la maintenabilité
L'apprentissage automatique appris avec Pokemon
Ensemble de données pour l'apprentissage automatique
Prétraitement japonais pour l'apprentissage automatique
Programmation Python Machine Learning Chapitre 2 Problèmes de classification - Résumé de la formation à l'algorithme d'apprentissage automatique
Apprentissage automatique dans Delemas (s'entraîner)
Une introduction à l'apprentissage automatique
Machine Learning: Supervision - Régression linéaire
Bases de l'apprentissage automatique (mémoire)
Un débutant en apprentissage automatique a essayé la RBM
[Apprentissage automatique] Comprendre la forêt aléatoire
Apprentissage automatique avec Python! Préparation
Résumé du site où vous pouvez apprendre gratuitement le machine learning
Implémenter Naive Bayes dans Python 3.3
Bloc-notes de ressources d'étude d'apprentissage automatique
Comprendre l'apprentissage automatique ~ régression de crête ~.
À propos de la matrice mixte d'apprentissage automatique
Apprentissage automatique: forêt supervisée - aléatoire
Mémo pratique du système d'apprentissage automatique
Démineur d'apprentissage automatique avec PyTorch