Schreiben Sie für Ubuntu 14.04 ein Memo über die Umgebungskonstruktion, damit CaboCha, das eine japanische Analyse der Abhängigkeit natürlicher Sätze durchführt, aus Python 2.7 verwendet werden kann.
Zunächst wird MeCab benötigt, das unter CaboCha eine morphologische Analyse durchführt. Wenn Sie Ubuntu 14.04 haben, können Sie MeCab 0.996 mit apt-get installieren.
$ sudo apt-get install build-essential mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8 python-mecab
$ mecab --version
mecab of 0.996
$ mecab-config --version
0.996
$ mecab
Von den Oberschenkeln und Oberschenkeln
Sumomo Substantiv,Allgemeines,*,*,*,*,Sumomo,Sumomo,Sumomo
Auch Assistent,Hilfe,*,*,*,*,Ebenfalls,Mo.,Mo.
Oberschenkel Nomen,Allgemeines,*,*,*,*,Pfirsiche,Pfirsich,Pfirsich
Auch Assistent,Hilfe,*,*,*,*,Ebenfalls,Mo.,Mo.
Oberschenkel Nomen,Allgemeines,*,*,*,*,Pfirsiche,Pfirsich,Pfirsich
Hilfswörter,Union,*,*,*,*,von,Nein,Nein
Davon Nomenklatur,Nicht unabhängig,Anwalt möglich,*,*,*,Zuhause,Uchi,Uchi
EOS
Erstellen Sie dann CRF ++ - 0.58.tar.gz. Es scheint, dass die CaboCha-Bibliothek darauf verweist, daher müssen Sie zuerst CRF ++ installieren. Verwendet MeCab den Befehl crf_learn
intern aufgrund der Verwendung des * bedingten Wahrscheinlichkeitsfelds * (CRF) oder ist zum Kompilieren ein Header oder eine Bibliothek erforderlich?
$ tar zxvf CRF++-0.58.tar.gz
$ cd CRF++-0.58/
$ ./configure
$ make
$ sudo make install
$ sudo ldconfig
Laden Sie cabocha-0.69.tar.gz von der offiziellen Website herunter und erstellen Sie CaboCha 0.69 + cabocha-python.
$ tar zxvf cabocha-0.69.tar.gz
$ cd cabocha-0.69
$ ./configure --with-mecab-config=`which mecab-config` --with-charset=UTF8
$ make
$ sudo make install
$ cabocha --version
cabocha of 0.69
$ cabocha
Von den Oberschenkeln und Oberschenkeln
Schenkel-D
Schenkel---D
Schenkel-D
Zuhause
EOS
$ cd python
$ python setup.py install #sudo/Darf usr eingeben
$ python -c "import CaboCha; p=CaboCha.Parser(); print(p.parseToString('Von den Oberschenkeln und Oberschenkeln'))"
Schenkel-D
Schenkel---D
Schenkel-D
Zuhause
EOS
Beachten Sie, dass setup.py
keine Python 3-Syntaxbeschränkungen unterstützt. Wenn Sie es also zu Python 3 sagen können, müssen Sie es beheben (danach suchen).
das ist alles.
Recommended Posts