Ich weiß nicht, ob es tatsächlich das Stärkste ist, aber so denke ich, ist es das
Es funktioniert durch Kopieren in die Codezelle von Google Colab (wahrscheinlich). Es wird einige Zeit dauern, bis wir "machen", also lass uns Kaffee trinken und warten ☕️
google_colab.ipynb
%%bash
#Mecab und Mecab-Installieren Sie Python3-Abhängigkeiten
apt-get install mecab swig libmecab-dev mecab-ipadic-utf8
# mecab-Python-Installation
pip install mecab-python3
#crfpp herunterladen(Cabocha-Abhängigkeiten)
curl -sL -o CRF++-0.58.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ"
tar -zxf CRF++-0.58.tar.gz
#crfpp Installation
cd CRF++-0.58
./configure && make && make install && ldconfig
cd ..
#Cabocha herunterladen
url="https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU"
curl -sc /tmp/cookie ${url} >/dev/null
code="$(awk '/_warning_/ {print $NF}' /tmp/cookie)"
curl -sLb /tmp/cookie ${url}"&confirm=${code}" -o cabocha-0.69.tar.bz2
tar -jxf cabocha-0.69.tar.bz2
#Cabocha-Installation
cd cabocha-0.69
./configure -with-charset=utf-8 && make && make check && make install && ldconfig
# cabocha-Python-Installation
pip install python/
cd ..
%%bash
mecab -v
pip show mecab-python3 | grep -e Name -e Version && echo
cabocha -v && echo
pip show cabocha-python | grep -e Name -e Version
output
mecab of 0.996
Name: mecab-python3
Version: 0.996.5
cabocha of 0.69
Name: cabocha-python
Version: 0.69
import MeCab
tagger = MeCab.Tagger()
print(tagger.parse("Der Kunde nebenan ist ein Kunde, der oft Kakis isst"))
output
Nachbarnomenklatur,Allgemeines,*,*,*,*,neben an,Tonari,Tonari
Hilfswörter,Union,*,*,*,*,von,Nein,Nein
Kundennomenklatur,Allgemeines,*,*,*,*,Kunde,Cuck,Cuck
Ist ein Assistent,Hilfe,*,*,*,*,Ist,C.,Beeindruckend
Gut ergänzt,Allgemeines,*,*,*,*,Häufig,Yoku,Yoku
Kaki Substantiv,Allgemeines,*,*,*,*,Persimmon,Auster,Auster
Verb essen,Unabhängigkeit,*,*,Godan / Wa Line Erinnerung,Grundform,Essen,Ku,Ku
Kundennomenklatur,Allgemeines,*,*,*,*,Kunde,Cuck,Cuck
Hilfsverb,*,*,*,Besondere,Grundform,Ist,Da,Da
EOS
import CaboCha
cp = CaboCha.Parser()
print(cp.parseToString("Der Kunde nebenan ist ein Kunde, der oft Kakis isst"))
output
neben an-D
Kunden-------D
Häufig---D |
Persimmon-D |
Essen-D
Es ist ein Kunde
EOS