Japanischer Abhängigkeitsanalysator. Wird für die Verarbeitung natürlicher Sprache verwendet.
Wie Sie auf der offiziellen Website sehen können, sollten Sie die Quelle grundsätzlich herunterladen und mit dem folgenden Befehl eingeben. Sie müssen auch CRF ++ und Mecab im Voraus installieren.
./configure
make
make check
sudo make install
Wenn Sie es mit Python verwenden möchten, können Sie im Python-Ordner auch Folgendes tun.
python setup.py install
Der offizielle Download-Link springt zum öffentlichen Ordner von Google Drive, sodass ich keinen Moment wusste, was ich mit der für wget angegebenen URL tun soll, wenn ich sie in CentOS einbinde. Vorläufig konnte ich es unten herunterladen. (Nur CRF ++ wurde bei Google Code authentifiziert ...)
- | url |
---|---|
Mecab | http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2 |
CRF++ | https://googledrive.com/host/0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0/CRF++-0.58.tar.gz |
Cabocha | http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2 |
iconv conversion failed. skip this entry.... Ich denke, dass die folgende Warnung (?) In einer Reihe erscheint, wenn Sie es machen.
iconv conversion failed. skip this entry....
Es scheint ein Problem mit der Codierung zu sein. In ./configure stehen folgende Optionen zur Verfügung:
./configure --with-charset=utf8 --enable-utf8-only
Ich bekomme diese Art von Fehler beim Machen
error while loading shared libraries: libcrfpp.so.0: cannot open shared object file: No such file or directory
Dies hängt von der Umgebung ab, ist jedoch in Ordnung, wenn Sie die Abhängigkeitsinformationen hinzufügen.
echo "/usr/local/lib" >> /etc/ld.so.conf.d/lib.conf
ldconfig
Ich denke, string.split (cmd1 (str))
wird irgendwie wütend.
Dieser Fehler tritt auf, weil der Cabocha-Code Python3 nicht unterstützt.
Eine freundliche Person hat die Patch-Datei geschrieben. Ändern Sie daher die Quelle entsprechend.
Vorerst so. Ich könnte es hinzufügen, wenn etwas wieder passiert.