Es ist eine sehr rudimentäre Geschichte, aber ich habe einige Punkte gefunden, die bei der Verwendung einer Bibliothek, die Stimmungsanalysen durchführen kann, zu beachten sind.
In Bezug auf TextBlob der Python-Bibliothek, wenn Sie die -.sentiment-Methode dieser Bibliothek verwenden, die Polarität und Subjektivität (Polarität: Polarität. Text) einfacher Sätze Ist positiv oder negativ. Subjektivität: Unabhängigkeit. Ob die Haltung des Sprechers positiv oder negativ ist, kann analysiert werden. Bitte werfen Sie einen Blick auf den analysierten Bericht unter hier.
Sie können auch die .sentiment-Methode verwenden, um Trends in Büchern und den Bewusstseinsfluss fiktiver Charaktere zu analysieren. Das Problem ist jedoch, dass die Stimmungsanalyse von TextBlob eine Black Box ist.
In den offiziellen Dokumenten, Muster der Universität Antwerpen, Computerlinguistik und Psycholinguistik Es gibt eine Anleitung, die das Text Mining-Modul und den Datensatz sowie den Naive Bayes-Klassifikator der NLTK-Bibliothek verwendet. Mit anderen Worten, wenn Sie die Quellen dieser beiden nicht kennen, können Sie nicht verstehen, warum dieser Wert für Polarität / Unabhängigkeit herausgekommen ist. Es scheint notwendig zu sein, zu überprüfen, welche Art von Klassifizierungsergebnis in Zukunft mit der .sentiment-Methode erzielt wird.
Am wichtigsten ist: "Die .sentiment-Methode von TextBlob ermöglicht keine kontextsensitive Analyse von Merkmalen." Im Rahmen der Überprüfung schrieb ich 10 Textzeilen mit ethischen Ritualen wie Moses '10 Geboten und verglich die Texte mit den genau entgegengesetzten Ritualen ...
We must be ethical. We must have the independence of will. We must be based on the concept of duty. We must think universally. We must not tell lies. We must not kill ourselves. We must cultivate our talent very arbitrary. We must be kind to each other. We must preserve our own lives. We must secure our happiness.
We must not be ethical. We must not have the independence of will. We must not be based on the concept of duty. We must not think universally. We must tell lies. We must kill ourselves. We must not cultivate our talent very arbitrary. We must not be kind to each other. We must not preserve our own lives. We must not secure our happiness.
Das Ergebnis ist, dass beide Texte fast die gleiche Polarität und Unabhängigkeit haben. Ich hatte vorausgesagt, dass Hilfsverben, die persönliche Synonyme und Modalitäten darstellen, einschließlich meiner selbst, wie „Wir“ und „Muss“, die Subjektivität erhöhen würden, aber anscheinend ist dies nicht der Fall. Beachten Sie auch, dass das Hinzufügen von "nicht", um die Bedeutung des Satzes vollständig umzukehren, die Polarität oder Unabhängigkeit überhaupt nicht ändert. Insbesondere,
- "Wir dürfen nicht ethisch sein." *
Solche Sätze gelten auch als "positive und unabhängige Texte".
Die .sentiment-Methode von TextBlob kann nur einen abstrakten Eindruck analysieren, z. B. "ob das verwendete Wort vollständig positiv ist oder nicht?" Und "Ist die Person, die es geschrieben hat, wirklich unabhängig und positiv?" Es stellt sich heraus, dass es unangemessen ist, ein bestimmtes Profil wie "?" Zu kennen. Um es für den letzteren Zweck zu verwenden, ist es notwendig, eine andere Bibliothek zu verwenden, die Merkmale aus dem Kontext analysieren kann, oder die Bedeutung von Sätzen bis zu einem gewissen Grad durch syntaktische Analyse zu erfassen und zur Kennzeichnung zu verwenden. Mein aktuelles Ziel ist es, die Merkmale ethischer Lebensmethoden in Datensätzen für maschinelles Lernen zu verwenden. Daher möchte ich einen weiteren Bericht schreiben, sobald ich eine gute Lösung gefunden habe.
Recommended Posts