Ich habe die Twitter-API schon lange berührt und mich schließlich entschlossen, eine morphologische Analyse durchzuführen. Das Folgende ist die Quelle, aus der ich das Gefühl habe, dass ich von hier aus verschiedene Dinge entwickeln und spielen kann.
meca.py
#!/user/bin/env python
# -*- coding: utf-8 -*-
from requests_oauthlib import OAuth1Session
import json
import sys
import MeCab
C_KEY = "********************************"
C_SECRET = "********************************"
A_KEY = "********************************"
A_SECRET = "********************************"
def Home_timeline():
url = "https://api.twitter.com/1.1/statuses/home_timeline.json"
params = {
"lang": "ja",
"count": "100"
}
tw = OAuth1Session(C_KEY,C_SECRET,A_KEY,A_SECRET)
req = tw.get(url, params = params)
tweets = json.loads(req.text)
for tweet in tweets:
f = open("test.txt" , "aw")
lists = (tweet["text"].encode("utf-8"))
f.write(lists)
f.flush()
f.close()
def Mecab_file():
f = open("test.txt","rb")
data = f.read()
f.close()
mt = MeCab.Tagger("-Ochasen")
print mt.parse(data)
Home_timeline()
Mecab_file()
Es ist immer noch nicht schön, aber ich denke, der Prozess, den es macht, ist leicht zu verstehen. Ich weiß nicht, ob f.flush () benötigt wird, aber nur für den Fall. Danach wird es zur morphologischen Analyse an Mecab übergeben. Das Ergebnis der morphologischen Analyse wird durch Analyse angezeigt, aber ich möchte es so ändern, dass es leicht zu sehen ist.
Beim Importieren des MeCab-Moduls hat der Codec gestört, daher importiere ich nur sys.