Es ist ein Jahr her, seit das Verbot von Online-Wahlen aufgehoben wurde, und jedes Mal, wenn die Wahl vorbei ist, ist es ein Sprachraum, der die verbleibenden Maschinen der Demokraten und Japans wie ein Sperunker reduziert. Wie geht es euch allen heute?
Dieses Mal werde ich übrigens den Inhalt der Tweets vor und nach der Eröffnung der Abstimmung untersuchen.
2014/12/14 Von 18:00 bis 07:00 Sammeln Sie Tweets mit den folgenden Informationen
#Wahl,#Wahl des Repräsentantenhauses,Wahl
** Erhalten Sie mithilfe der Streaming-API in Python weiterhin Tweets mit bestimmten Schlüsselwörtern ** http://qiita.com/mima_ita/items/ecdf7de2fe619378beee
https://github.com/mima3/stream_twitter
Bestätigt für die Arbeit mit Windows7 Python 2.7
Die gesammelten Daten können von folgenden heruntergeladen werden. http://needtec.sakura.ne.jp/doc/shuin47twitter.zip
Schauen wir uns zunächst die Anzahl der Tweets nach Zeit an. Schauen wir uns die stündlichen Daten von 18:00 bis 07:00 Uhr am 14.12.2014 mit dem obigen Code an.
python twitter_db_hist.py "2014/12/14 9:00" "2014/12/14 22:00" 3600
Das Ergebnis ist wie folgt:
Zeit (UTC) | Japan Zeit | Nummer |
---|---|---|
12/14 09:00 | 12/14 18:00 | 3149 |
12/14 10:00 | 12/14 19:00 | 4047 |
12/14 11:00 | 12/14 20:00 | 11280 |
12/14 12:00 | 12/14 21:00 | 9755 |
12/14 13:00 | 12/14 22:00 | 7199 |
12/14 14:00 | 12/14 23:00 | 5207 |
12/14 15:00 | 12/14 00:00 | 3472 |
12/14 16:00 | 12/14 01:00 | 3801 |
12/14 17:00 | 12/14 02:00 | 1545 |
12/14 18:00 | 12/14 03:00 | 529 |
12/14 19:00 | 12/14 04:00 | 292 |
12/14 20:00 | 12/14 05:00 | 300 |
12/14 21:00 | 12/14 06:00 | 477 |
Der Zeitpunkt für die Eröffnung der Abstimmung um 20:00 Uhr ist der höchste. Und die Anzahl der Tweets wird mit der Zeit abnehmen. Es wurde jedoch in den 1: 00er Jahren wiederbelebt, und danach nahm die Anzahl der Tweets ab, und es erholte sich ein wenig von ungefähr 5:00 Uhr, als ich aufwachte.
Es ist verständlich, dass die Anzahl der Tweets mitten in der Nacht abnimmt und morgens zunimmt. Aber was ist der Grund für die Zunahme der Anzahl der Tweets um Mitternacht 1: 00s?
Schauen wir uns aus diesem Grund die 1: 00s in 1-Minuten-Einheiten an.
python twitter_db_hist.py "2014/12/14 16:00" "2014/12/14 17:00" 60
Wenn man dieses Ergebnis betrachtet, zeigt es eine schnelle Aufregung um 1:27 Minuten.
Was ist zu dieser Zeit passiert? Schauen wir uns hier die Fäden der Leute des Kaieda-Instituts an, die die Demokratische Partei lieben.
** [Fukatsu no Jumon ist anders] Kaieda Democratic Party Research 802. [Tosen no Sho wurde entschieden] ** http://anago.2ch.net/test/read.cgi/asia/1418565521/
811: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:26:44.86 ID:tG+ZZ8gB
[Aktuelle Nachrichten] Die Vertreterin der Demokratischen Partei, Mari Kaieda, wurde im proportionalen Block von Tokio nicht wiederbelebt, und die Wahl wurde bestätigt (01).:19)(c)2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1418574054/
812: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:26:49.76 ID:4Us97nfn
Verlorene Entscheidung w
813: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:26:51.11 ID:pW7uplw3
Auf Wiedersehen, Mari
814: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:27:01.20 ID:yIjazH47
Wow ah ah NHK hat auch w verloren
815: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:27:02.02 ID:NOhUWn58
Mali bei NHK komplett besiegt
Nein, ich gehe von hier nach Phoenix! Es ist definitiv Fenix, also _____
816: Kein Name des Ortes, an dem die Sonne aufgeht: 2014/12/15(Mond) 01:27:08.70 ID:4zmUGrZE
>>802
㌧. Ich habe keine Gurken gekauft, damit ich die Makrelendose öffnen kann
Wenn man die damalige Situation betrachtet, scheint es, dass Asahi die proportionale Niederlage von Kaieda als Extra um 1:19 meldete, und NHK berichtete auch um die Nachrichten um 1:27.
Wie erwartet kann gesagt werden, dass der Aufstieg und Rückzug des Führers der ersten Oppositionspartei dazu führte, dass die schläfrigen Augen des Twitterers um Mitternacht ausgelöscht wurden. Aus diesem Ergebnis ist auch ersichtlich, dass der Fernseher eine stärkere Diffusionskraft als die zusätzliche Zeitung hat.
Schauen wir uns als nächstes häufige Wörter an. Mit Mecab führten wir eine morphologische Analyse durch und aggregierten die Wörter.
Dies kann mit dem folgenden Skript erfolgen.
python twitter_db_mecab.py "2014/12/14 9:00" "2014/12/14 22:00" > mecab.txt
Die besten 100 werden unten angezeigt.
Wort | Anzahl der Auftritte |
---|---|
Wahl | 70626 |
Station | 33315 |
Auswahl | 27196 |
Repräsentantenhaus | 27152 |
Wählen | 13740 |
1 | 11698 |
Wahrscheinlich | 8386 |
LDP | 7403 |
Aktuelle Nachrichten | 7120 |
Herr | 7074 |
Tokio | 6864 |
Wählen | 6484 |
Gewinnen | 6456 |
Roh | 6443 |
NHK | 6222 |
0 | 5866 |
# | 5519 |
Hat verloren | 5504 |
official | 5488 |
kyodo | 5487 |
Sicher | 5384 |
2 | 5352 |
Party | 5236 |
Extra | 5229 |
Sitz | 5025 |
gehen | 4811 |
Mann | 4796 |
BqAAr | 4633 |
vlhS | 4606 |
Bewertung | 4460 |
Proportional | 4419 |
LDP | 4302 |
Block | 4208 |
4 | 4196 |
Teru | 4035 |
Tag | 3912 |
Kandidat | 3811 |
Repräsentantenhaus | 3782 |
seiji | 3773 |
9 | 3745 |
Während ~ | 3726 |
Japan | 3611 |
jimin | 3607 |
koho | 3603 |
Vertreter | 3599 |
Demokratie | 3592 |
3 | 3589 |
Person | 3548 |
nicohou | 3490 |
JNSC | 3203 |
blogos | 3170 |
ld | 3125 |
Name | 3098 |
Abe | 3068 |
demokratische Partei | 3039 |
Erzählen | 3011 |
Besondere Nummer | 2959 |
Nächste Generation | 2889 |
% | 2881 |
Zeit | 2844 |
Nico | 2817 |
Sein | 2750 |
Aussehen | 2727 |
Schlage Takeshi | 2723 |
Sein | 2721 |
Kanagawa | 2690 |
Politik | 2532 |
5 | 2511 |
Kaieda | 2504 |
es kann | 2488 |
Protokoll | 2424 |
Lange | 2371 |
Jahr | 2315 |
Anzeigen | 2315 |
Okinawa | 2231 |
Wiederbelebung | 2176 |
Oben | 2092 |
U. | 1997 |
Erworben | 1977 |
Abstimmung | 1954 |
Abwesend | 1953 |
Aktuell | 1926 |
Wiederherstellung | 1905 |
Premierminister | 1898 |
Drücken Sie | 1888 |
Bericht | 1882 |
Teich | 1831 |
nehmen | 1775 |
Kommunistische Partei | 1773 |
Ersatz | 1769 |
notwendig | 1766 |
nMDR | 1761 |
YidT | 1761 |
Jugend | 1750 |
Ziel | 1727 |
Papier | 1712 |
Mari | 1666 |
senkyost | 1645 |
Information | 1628 |
Ich würde es gerne tun | 1618 |
Immerhin war der am meisten extrahierte Parteiename "LDP", der die Mehrheit übernahm. Als nächstes kommt die "Demokratische Partei", gefolgt von der "nächsten Generation" und dann der "Erneuerung" und der "Kommunistischen Partei". Die Partei der nächsten Generation scheint eine erhebliche Lücke zwischen der tatsächlichen Anzahl der Sitze und dem Grad der Aufmerksamkeit im Netz zu haben.
"Tokyo" und "Okinawa" wurden nach Ortsnamen extrahiert. Was Tokio betrifft, gab es einen Retweet des Artikels "Tokyo Shimbun", der viel extrahiert wurde, und für Okinawa war die LDP in Form der Vernichtung der kleinen Wahlkreise, so dass angenommen wird, dass sie mehr Aufmerksamkeit auf sich zog als andere Bereiche.
Die Namen der Leute, die Aufmerksamkeit erregten, waren "Abe", "Beat Takeshi" und "Kaieda". Ganz zu schweigen vom Premierminister und dem Führer der ersten Oppositionspartei, war es überraschend, dass "Beat Takeshi" bemerkt wurde. Anscheinend liegt das daran, dass "Beat Takeshi" in Nico Nama auftrat.
Lassen Sie uns abschließend Cabocha verwenden, um die Beziehung zwischen Klauseln zu tabellieren. Im Folgenden erfahren Sie, wie Sie Cabocha unter Windows installieren.
** Setzen Sie Cabocha in Windows ein und analysieren Sie die Abhängigkeit mit Python ** http://qiita.com/mima_ita/items/161cd869648edb30627b
Diesmal habe ich mit 0,66 analysiert. Ich denke, die neuesten Ergebnisse werden ähnlich sein.
Dies kann mit dem folgenden Skript erfolgen.
python twitter_db_cabocha.py "2014/12/14 9:00" "2014/12/14 22:00" > cabocha.txt
Die besten 100 werden unten angezeigt.
Klausel 1 | Klausel 2 | Anzahl der Auftritte |
---|---|---|
Hat verloren | Sicher | 1762 |
co/ | 4nMDR4YidT#Parlamentswahlen http://t | 1557 |
Abstimmungsrate | 0% | 1538 |
[Wahl] Wahl des Repräsentantenhauses, | Teen | 1534 |
Teen | Abstimmungsrate | 1534 |
Jugend | gehen | 1504 |
Name | schreiben | 1504 |
RT@whsaito:Stimmzettel | Ausfüllen | 1502 |
Name | Ausfüllen | 1502 |
Auf jeden Fall Kandidat | Name | 1502 |
Methode | nehmen | 1502 |
hoch | Japan | 1502 |
schreiben | gehen | 1502 |
nehmen | Japan | 1502 |
Ausfüllen | Methode | 1502 |
14 .. | gehen | 1502 |
Bildungsniveau | hoch | 1502 |
RT@kyoho_times: | Teen | 1460 |
Wiederbelebung | Sicher | 1288 |
Kerl | Sieg | 1208 |
Eine solche | Kerl | 1208 |
gehen-Verweigerung | Sieg | 1186 |
Wahrscheinlich | Bericht | 1172 |
3700kei:#Parlamentswahlen | gehen-Verweigerung | 1141 |
RT@keisei | 3700kei:#Parlamentswahlen | 1107 |
Proportionaler Tokio-Block | Wiederbelebung | 1075 |
RT@kyodo_official:demokratische Partei | Vertreterin von Mari Kaieda | 964 |
Vorsitzender Satoshi Katayama | Verlieren | 928 |
Verlieren | Verlieren | 928 |
Vertreterin von Mari Kaieda | Wiederbelebung | 928 |
Opposition | Verlieren | 928 |
sozialistische Partei | Vorsitzender Satoshi Katayama | 928 |
1949 Wahl des Repräsentantenhauses | Verlieren | 928 |
Niederlage | Sicher | 914 |
Jedermann | Politik http://t | 885 |
Gewinnen | Sicher | 815 |
Sonderseite zur Wahl des Repräsentantenhauses | →http://t | 761 |
Gefühl | #Wahl | 755 |
Abstimmungsort | Hör mal zu | 755 |
1 Stimme | Spalt | 755 |
Spalt | Gefühl | 754 |
Hör mal zu | Gefühl | 754 |
Mädchenhochschule | Hör mal zu | 754 |
RT@kurosia:Bekanntschaft | Abstimmungsort | 752 |
Der niedrigste nach dem Krieg | Letztes Mal | 742 |
RT@ld_blogos: | [Aktuelle Nachrichten] | 663 |
Nächste Generation | Party | 633 |
[Aktuelle Nachrichten] | Wahrscheinlich | 561 |
Unten | http://t | 551 |
RT@kyodo_official:Nächste Generation | Party | 546 |
Wahl des Repräsentantenhauses | Abstimmungsrate | 535 |
Wann | Zustand | 514 |
Herr Kiyomi Tsujimoto, demokratischer 10. Bezirk von Osaka | Wahrscheinlich | 475 |
Kandidateninformationen | Wahl des Repräsentantenhauses | 2014-Yahoo |
Nachmittag | Ab 6 Uhr | 424 |
Abstimmungsrate | 34 | 424 |
79 Punkte | Unten | 420 |
Nationaler Durchschnitt | 34 | 420 |
Ab 6 Uhr | 34 | 420 |
98% | Letztes Mal | 420 |
Durch | 34 | 420 |
RT@senkyost: | [Erworbene Sitze___ | 386 |
Wählen | gehen | 379 |
Recht auf kollektive Selbstverteidigung | Übungsannahme | 377 |
Niederlage | Bericht | 370 |
Wahrscheinlich | Brechen | 367 |
Ding | kennt | 363 |
Japan | kennt | 360 |
Kehre zur J League zurück | kennt | 359 |
Wenn das passiert | Lauf | 359 |
allmählich | Kehre zur J League zurück | 359 |
ich | Lauf | 359 |
notwendig | Erzählen | 357 |
Gewinner#Ich hoffe, mich zu verbreiten___#RT | Folge allen | 356 |
[Traurige Neuigkeiten] Für Animationen | notwendig | 356 |
Verordnung | notwendig | 356 |
Gewinner | notwendig | 356 |
Erzählen | #Wahl http://t | 355 |
Folge allen | #Wahl http://t | 355 |
8bu_: | notwendig | 352 |
RT@K | 8bu_: | 352 |
#Wahl#NHK#衆議院Wahl#Ikegami | Wahl#Wählen | 344 |
Herr Ishihara | Ein Statement abgeben | 341 |
Party | Shintaro Ishihara Chefberater | 341 |
Diesmal Wahl des Repräsentantenhauses | Aus der politischen Welt zurückgezogen | 341 |
Shintaro Ishihara Chefberater | Hat verloren | 341 |
Aus der politischen Welt zurückgezogen | Ein Statement abgeben | 341 |
co/ | 7LGbX1z | 322 |
RT@mainichijpedit:Ministerium für innere Angelegenheiten und Kommunikation | Durch | 309 |
Verstehen | erhalten | 304 |
___http | ://t | 303 |
Menschen | Verstehen | 303 |
RT@jimin_koho: | /Machen | 301 |
Ding | Sicher | 278 |
RT@jimin_koho: | / | 270 |
Übungsannahme | Ausdrücken | 268 |
LDP | Ausdrücken | 268 |
Ausdrücken | Seiichiro Murakami | 268 |
Opposition | Ausdrücken | 268 |
2. Station | Ausdrücken | 268 |
Verloren → Da die Gewissheit an erster Stelle steht, scheint Twitter mehr daran interessiert zu sein, wer fallen gelassen wird als wer akzeptiert wird.
Es scheint auch, dass es viele Hinweise auf die Abstimmungsrate junger Menschen gibt. Es ist jedoch auch wahr, dass es viele Nachrichten gibt, dass "die Abstimmungsrate von Teenagern 0% beträgt".
"Hoch" -> "Japan" scheint das Ergebnis einer großen Anzahl von Retweets von Tweets zu sein, die sagen: "Nur Japan mit einem hohen Bildungsniveau verwendet die Methode, einen Namen auf ein Abstimmungsformular zu schreiben."
Wie ich eingangs erwähnte, untersuchte ich auch die Demokratie und Japan, wo die verbleibenden Möglichkeiten bei jeder Wahl reduziert werden. Von den beiden Tweets, die besagen, dass die Demokratie sterben wird, gibt es 11 Tweets, die besagen, dass die Demokratie nicht sterben wird. Es scheint also, dass die verbleibende Chance der Demokratie wahrscheinlich nicht geringer ist als erwartet.
Die folgenden Wörter zur Reduzierung der verbleibenden Maschine wurden jedoch extrahiert.
Klausel 1 | Klausel 2 | Anzahl der Auftritte |
---|---|---|
Demokratie | sterben | 2 |
Demokratie | Ende | 2 |
Demokratie | Ende | 2 |
Demokratie | Zusammenbruch | 2 |
···Demokratie | Zusammenbruch | 1 |
Wie die Reduzierung der verbleibenden Flugzeuge von Nihon-Chan ist wie folgt.
Klausel 1 | Klausel 2 | Anzahl der Auftritte |
---|---|---|
RT@inosan08260:Japan Ende bestätigt | 178kakapo:Japan | 7 |
LDP | Japan bricht zusammen | 4 |
Bereits | Japan bricht zusammen | 4 |
Lächerlich | Japan bricht zusammen | 4 |
Japan | Zerquetschen | 2 |
Japan | Ende | 2 |
Aus diesem Ergebnis geht hervor, dass die Anzahl der verbleibenden demokratischen Flugzeuge bei dieser Wahl auf 9 gesunken ist und die Anzahl der verbleibenden Flugzeuge Japans um etwa 23 gesunken ist.
・ Wenn Herr Kaieda arbeitslos wird, wird er aufgeregt, obwohl es Mitternacht ist, und wenn er sieht, dass der Ausdruck Niederlage → Gewissheit häufig vorkommt, fällt auf, wer fallen wird, wer es akzeptiert.
・ Wenn man sich die Anzahl der Auftritte des Wortes „nächste Generation“ und die tatsächlichen Ergebnisse ansieht, kann man sagen, dass aufgrund der Aufmerksamkeit im Netz keine Plätze besetzt werden können.
・ Demokratie und Japan hatten das Bild, dass die verbleibenden Maschinen bei jeder Wahl abnehmen, aber diesmal scheint dies nicht der Fall zu sein.
Sie können eine solche Scheinanalyse durchführen. Bei stündlichen Tweets, wie in diesem Beispiel, sollten Sie sich die Zunahme und Abnahme der Daten ansehen und im Detail untersuchen, wo sich etwas geändert hat.
Es ist leicht zu erkennen, dass die Worthäufigkeit sicherlich viel Aufmerksamkeit erhält. Es ist jedoch zu beachten, dass eine große Anzahl von Extrakten für dieses Beispiel nicht immer eine positive Reaktion ist.
Für die Abhängigkeitsanalyse kann es möglich sein, die Schwäche der Untersuchung häufiger Nur-Wort-Vorkommen zu überwinden. Aber ehrlich gesagt hätte ich diese Möglichkeit diesmal nicht vollständig erkannt. Dies wird ein Thema für die Zukunft sein.
Übrigens konnte ich den Tweet des Schlusssteins mit dem Filter der Streaming-API nicht erhalten.
Recommended Posts