Dieses Mal analysierte ich die Tweet-Daten von ** English ** für ungefähr ein Jahr mit der in ICWSM-14 vorgeschlagenen Emotionsanalysemethode namens VADER. Für VADER habe ich auf den Artikel Sentiment Analysis ist bei NLTK eingetroffen verwiesen. Vielen Dank.
VADER VADER ist in Pythons Paket zur Verarbeitung natürlicher Sprache nltk implementiert. Versuchen Sie es.
In [1]: from nltk.sentiment.vader import SentimentIntensityAnalyzer
In [2]: analyzer = SentimentIntensityAnalyzer()
In [3]: analyzer.polarity_scores("I am happy!!!")
Out[3]: {'compound': 0.6784, 'neg': 0.0, 'neu': 0.179, 'pos': 0.821}
Und "Verbindung", "Neg" (Nagativ), "Neu" (Neutral), "Pos" (Positiv) werden von 0 bis 1 ausgegeben.
Englische Tweets, die von der Twitter Streaming API vom 31.10.2014 bis zum 28.10.2015 erhalten wurden (ich habe sie von meinem Senior erhalten!). Es gab 1089358 Tweets pro Tag. Für jeden Tweet wurde eine emotionale Analyse durchgeführt, und der Wert von "pos" wurde täglich gemittelt. Darüber hinaus wurden die endgültigen Daten so standardisiert, dass der Durchschnitt 0 und die Standardabweichung 1 betrug.
In einem Artikel mit dem Titel Twitter-Stimmung sagt den Aktienmarkt voraus wurden die folgenden Ergebnisse mit OpinionFinder, einem Polaritätsanalysetool, und GPOMS erzielt, das sechs Arten von Emotionsfaktoren analysiert. Wurde erhalten. Es wird erwartet, dass der Wert von "pos" dieses Mal nahe am Happy-Ergebnis von Opinion Finder und GPOMS liegt.
Die erhaltenen Ergebnisse werden als Zeitreihendiagramm gezeichnet. Achten Sie darauf, dass einige Teile oben hervorstehen.
Jeder ist positiv, wenn es eine Veranstaltung gibt, um Spaß zu haben! !! Ich wollte den Teil analysieren, in dem der Wert von "neg" groß ist, aber ich habe die Ursache doch nicht verstanden.
Recommended Posts