[PYTHON] Zusammenfassung der Stolpersteine bei der Installation von CaboCha

Was ist CaboCha?

Japanischer Abhängigkeitsanalysator. Wird für die Verarbeitung natürlicher Sprache verwendet.

Grundlegende Installationsmethode

Wie Sie auf der offiziellen Website sehen können, sollten Sie die Quelle grundsätzlich herunterladen und mit dem folgenden Befehl eingeben. Sie müssen auch CRF ++ und Mecab im Voraus installieren.

./configure
make
make check
sudo make install

Wenn Sie es mit Python verwenden möchten, können Sie im Python-Ordner auch Folgendes tun.

python setup.py install

Der Teil, der zu stolpern scheint

Quell-URL

Der offizielle Download-Link springt zum öffentlichen Ordner von Google Drive, sodass ich keinen Moment wusste, was ich mit der für wget angegebenen URL tun soll, wenn ich sie in CentOS einbinde. Vorläufig konnte ich es unten herunterladen. (Nur CRF ++ wurde bei Google Code authentifiziert ...)

- url
Mecab http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2
CRF++ https://googledrive.com/host/0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0/CRF++-0.58.tar.gz
Cabocha http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2

iconv conversion failed. skip this entry.... Ich denke, dass die folgende Warnung (?) In einer Reihe erscheint, wenn Sie es machen.

iconv conversion failed. skip this entry....

Es scheint ein Problem mit der Codierung zu sein. In ./configure stehen folgende Optionen zur Verfügung:

./configure --with-charset=utf8 --enable-utf8-only

Fehler beim Laden der Bibliothek

Ich bekomme diese Art von Fehler beim Machen

error while loading shared libraries: libcrfpp.so.0: cannot open shared object file: No such file or directory

Dies hängt von der Umgebung ab, ist jedoch in Ordnung, wenn Sie die Abhängigkeitsinformationen hinzufügen.

echo "/usr/local/lib" >> /etc/ld.so.conf.d/lib.conf
ldconfig

(Python3) setup.py hat einen Fehler

Ich denke, string.split (cmd1 (str)) wird irgendwie wütend. Dieser Fehler tritt auf, weil der Cabocha-Code Python3 nicht unterstützt. Eine freundliche Person hat die Patch-Datei geschrieben. Ändern Sie daher die Quelle entsprechend.

Vorerst so. Ich könnte es hinzufügen, wenn etwas wieder passiert.

Recommended Posts

Zusammenfassung der Stolpersteine bei der Installation von CaboCha
Liste der Orte, auf die ich beim Hochladen von Bildern aus Django gestoßen bin
Zusammenfassung verschiedener Operationen in Tensorflow
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Zusammenfassung der häufig verwendeten Befehle in matplotlib
Zusammenfassung verschiedener for-Anweisungen in Python
Zusammenfassung der Module und Klassen in Python-TensorFlow2-
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Zusammenfassung der 2016 erstellten OSS-Tools und -Bibliotheken
Zusammenfassung zum Importieren von Dateien in Python 3
Zusammenfassung dessen, was bei 100 Pandas-Schlägen verwendet wurde (# 1 ~ # 32)
Zusammenfassung der Verwendung von MNIST mit Python
Zusammenfassung der beim maschinellen Lernen verwendeten Bewertungsfunktionen
Zusammenfassung der Fehlerbehandlungsmethoden bei der Installation von TensorFlow (2)
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
Zusammenfassung der Datumsverarbeitung in Python (Datum / Uhrzeit und Datum)
Tensorflow / Keras-Zusammenfassung
Zusammenfassung der Verwendung von pyenv
Zusammenfassung der Zeichenfolgenoperationen
Zusammenfassung der Python-Argumente
Zusammenfassung der Testmethode
Zusammenfassung der Prototypmuster der Einführung in Entwurfsmuster, die in Java gelernt wurden
Grundlegende Zusammenfassung der Datenoperationen in Python Pandas - Zweite Hälfte: Datenaggregation
[Von Zeit zu Zeit aktualisiert] Zusammenfassung der Entwurfsmuster in Java
Singleton-Musterzusammenfassung der Einführung in Entwurfsmuster, die in Java gelernt wurden
[Für Anfänger] Zusammenfassung der Standardeingabe in Python (mit Erklärung)
Zusammenfassung zum Schreiben von in gRPC verwendeten .proto-Dateien