Ich wollte dem Unicode-Problem entkommen, also habe ich Python3 gewählt, aber ich bekomme einen UnicodeDecodeError, weil mecab-python3 nicht richtig funktioniert.
Wenn Sie den Test ausführen, wird er außerdem zufällig ausgegeben
import MeCab
mecab = MeCab.Tagger()
node = mecab.parseToNode("Von den Oberschenkeln und Oberschenkeln")
while node:
print(node.surface)
node = node.next
Dann
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-11-1f88b1ec9c08> in <module>()
1 while node:
----> 2 print(node.surface)
3 node = node.next
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte
Der Fehler ist ...
Es ist schwer zu heilen, daher wird gesagt, dass zuerst mecab.parse ("") ausgeführt wird.
import MeCab
mecab = MeCab.Tagger()
mecab.parse("") #hinzufügen
node = mecab.parseToNode("Von den Oberschenkeln und Oberschenkeln")
while node:
print(node.surface)
node = node.next
Dann
Sumomo
Ebenfalls
Pfirsiche
Ebenfalls
Pfirsiche
von
Zuhause
erledigt. Ich bin nicht sicher, aber es fing an zu funktionieren.
Recommended Posts