Es wird davon ausgegangen, dass MeCab installiert ist.
pip install igo-python
mecab-ipadic-neologd
und führen Sie. / Bin / install-mecab-ipadic-neologd
aus. Dann haben Sie ein Build-Verzeichnis.igo-0.4.5.jar
nach mecab-ipadic-neologd / build / mecab-ipadic-2.7.0-20070801-neologd-20150401
und führen Sie den folgenden Befehljava -cp igo- aus. 0.4.5.jar net.reduls.igo.bin.BuildDic neologd. "Utf-8"
Das ist es. Ich werde versuchen zu sehen, ob es funktioniert hat.
Python 2.7.8 (default, Mar 31 2015, 12:51:47)
Type "copyright", "credits" or "license" for more information.
IPython 3.0.0 -- An enhanced Interactive Python.
? -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help -> Python's own help system.
object? -> Details about 'object', use 'object??' for extra details.
In [1]: import igo
In [2]: t = igo.tagger.Tagger('neologd') #Java früher~Pfad zu dem Verzeichnis, das in erstellt wurde
In [3]: for i in t.parse(u'Apple wird die Apple Watch am 24. April im Inland auf den Markt bringen.'):
...: print i.surface
...:
Apfel
Ist
Apple Watch
Zu
24. April
Zu
Inländisch
Veröffentlichung
Shi
Masu
。
Sie können Apple Watch mit normalem MeCab nicht auf einmal bekommen, aber dank mecab-ipadic-neologd können Sie es bekommen. Dieses Mal habe ich es in dem Verzeichnis ausgeführt, in dem neologd erstellt wurde, sodass es kein Problem gab. Wie ich jedoch im Kommentar geschrieben habe, müssen Sie bei der tatsächlichen Verwendung den Pfad zum erstellten neolog-Verzeichnis übergeben.
Dies ist praktisch, da Sie die Morphologie flexibel analysieren können, ohne MeCab zu installieren.
In dem Verzeichnis, in dem sich igo-0.4.5.jar befindet
java -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic Dictionary Speicherverzeichnispfad mecab-ipadic-neologd Pfad zum Buid-Verzeichnis Zeichencode
Wenn Sie eine Fehlermeldung wie "Ausnahme im Thread" main "java.lang.OutOfMemoryError: Java-Heapspeicher" erhalten, fügen Sie "-Xmx1024m" zu den Optionen hinzu. Ich kenne die Details nicht, aber es scheint, dass der Heap nicht ausreicht, daher würde ich ihn gerne durch Angabe der Größe sehen.
java -Xmx1024m -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic neologd . "utf-8"
Ich habe auf [hier] verwiesen (http://bakedmemo.blogspot.jp/2013/01/igo-php.html), aber ich habe den gleichen Fehler mit 1024 erhalten, also habe ich ihn irgendwie auf 2048 verdoppelt. Dann verschwand der Fehler.
Ich habe auf den folgenden Artikel verwiesen. Vielen Dank.
Recommended Posts