Naive Bayes basiert auf dem Bayes'schen Theorem und basiert auf der vorherigen Wahrscheinlichkeit und ihrer Wahrscheinlichkeit (Erklärung der Wahrscheinlichkeit). Die hintere Wahrscheinlichkeit wird berechnet und in die Kategorie mit der höchsten hinteren Wahrscheinlichkeit eingeteilt. Es ist berühmt dafür, Spam-Mails zu beurteilen.
Extracted from 'Introduction to Machine Learning', Udacity
Das Obige ist eine naive Vorhersage, ob Sara oder Chris es aus dem Text der 'LIFE DEAL'-E-Mail gesendet haben. Die Wahrscheinlichkeit, jede Mail von Chris und Sara zu senden, beträgt 50% (Vorwahrscheinlichkeit) Chris verwendet Wörter mit einer Rate von LIEBE 10%, DEAL 80%, LEBEN 10%, während Sara verwendet Wörter mit einer Rate von 30% LIEBE, 20% DEAL und 30% LIFE. (Möglichkeit)
Mit anderen Worten ist die hintere Wahrscheinlichkeit Vorwahrscheinlichkeit x Wahrscheinlichkeit = Nachwahrscheinlichkeit Chris 10% × 80% × 50% = 0.04 Sara 30% × 20% × 50% = 0.03
Wenn Sie dies beheben, 0,04 + 0,03 = 0,07 (dies ist 100%) Chris 0.04 / 0.07 = 0.57 → 57% Sara 0.03 / 0.07 = 0.43 → 43%
Mit anderen Worten, es besteht eine Wahrscheinlichkeit von 57%, dass es sich um Chris handelt. Das Ergebnis ist also, dass in der E-Mail LIFE DEAL steht Es ist als Chris klassifiziert.
python
from sklearn.naive_bayes import GaussianNB
GaussianNB(priors=None)
#Das ist der Standardcode, nicht wahr?
Da jedes Merkmal unabhängig betrachtet und in einer Dimension ausgedrückt wird, kann der Fluch der Dimentionalität gelindert werden.
--Schlechter Punkt
Wie Sie beispielsweise aus den ersten E-Mail-Entscheidungen von Chris und Sara ersehen können, untersucht Naive Bayes nur die Häufigkeit von Wörtern, sodass die Reihenfolge oder Kombination von Sätzen nicht bestimmt werden kann. Wenn Sie beispielsweise auf Englisch nicht nur vor einem Verb hinzufügen, kann sich die Bedeutung um 180 Grad ändern. Das heißt, die Merkmalsgrößen werden als eine unabhängige Merkmalsgröße betrachtet, und die Korrelation zwischen den Merkmalsgrößen wird nicht berücksichtigt.
Das Obige ist der Umriss von NaiveBayes, soweit ich verstehen kann. Wir werden es täglich aktualisieren. Wenn Sie also etwas hinzufügen oder reparieren müssen, würden wir uns freuen, wenn Sie einen Kommentar abgeben könnten.
Recommended Posts