Verwenden Sie mecab-ipadic-neologd mit igo-python

Es wird davon ausgegangen, dass MeCab installiert ist.

Verfahren

  1. Installieren Sie igo-python pip install igo-python
  2. Laden Sie [igo-0.4.5.jar] herunter (http://sourceforge.jp/projects/igo/releases/55029).
  3. Laden Sie mecab-ipadic-neologd herunter (Git-Klon)
  4. Gehen Sie zu mecab-ipadic-neologd und führen Sie. / Bin / install-mecab-ipadic-neologd aus. Dann haben Sie ein Build-Verzeichnis.
  5. Kopieren Sie igo-0.4.5.jar nach mecab-ipadic-neologd / build / mecab-ipadic-2.7.0-20070801-neologd-20150401 und führen Sie den folgenden Befehljava -cp igo- aus. 0.4.5.jar net.reduls.igo.bin.BuildDic neologd. "Utf-8"

Das ist es. Ich werde versuchen zu sehen, ob es funktioniert hat.

Python 2.7.8 (default, Mar 31 2015, 12:51:47)
Type "copyright", "credits" or "license" for more information.

IPython 3.0.0 -- An enhanced Interactive Python.
?         -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help      -> Python's own help system.
object?   -> Details about 'object', use 'object??' for extra details.

In [1]: import igo

In [2]: t  = igo.tagger.Tagger('neologd')  #Java früher~Pfad zu dem Verzeichnis, das in erstellt wurde

In [3]: for i in t.parse(u'Apple wird die Apple Watch am 24. April im Inland auf den Markt bringen.'):
   ...:     print i.surface
   ...:
Apfel
Ist
Apple Watch
Zu
24. April
Zu
Inländisch
Veröffentlichung
Shi
Masu
。

Sie können Apple Watch mit normalem MeCab nicht auf einmal bekommen, aber dank mecab-ipadic-neologd können Sie es bekommen. Dieses Mal habe ich es in dem Verzeichnis ausgeführt, in dem neologd erstellt wurde, sodass es kein Problem gab. Wie ich jedoch im Kommentar geschrieben habe, müssen Sie bei der tatsächlichen Verwendung den Pfad zum erstellten neolog-Verzeichnis übergeben.

Dies ist praktisch, da Sie die Morphologie flexibel analysieren können, ohne MeCab zu installieren.

wichtiger Punkt

Erläuterung der Befehle zum Kompilieren eines Wörterbuchs für igo

In dem Verzeichnis, in dem sich igo-0.4.5.jar befindet java -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic Dictionary Speicherverzeichnispfad mecab-ipadic-neologd Pfad zum Buid-Verzeichnis Zeichencode

Fehler beim Kompilieren des Wörterbuchs für igo

Wenn Sie eine Fehlermeldung wie "Ausnahme im Thread" main "java.lang.OutOfMemoryError: Java-Heapspeicher" erhalten, fügen Sie "-Xmx1024m" zu den Optionen hinzu. Ich kenne die Details nicht, aber es scheint, dass der Heap nicht ausreicht, daher würde ich ihn gerne durch Angabe der Größe sehen.

java -Xmx1024m -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic neologd . "utf-8"

Ich habe auf [hier] verwiesen (http://bakedmemo.blogspot.jp/2013/01/igo-php.html), aber ich habe den gleichen Fehler mit 1024 erhalten, also habe ich ihn irgendwie auf 2048 verdoppelt. Dann verschwand der Fehler.

Referenz

Ich habe auf den folgenden Artikel verwiesen. Vielen Dank.

Recommended Posts

Verwenden Sie mecab-ipadic-neologd mit igo-python
Verwenden Sie RTX 3090 mit PyTorch
Verwenden Sie ansible mit cygwin
Verwenden Sie pipdeptree mit virtualenv
[Python] Verwenden Sie JSON mit Python
Verwenden Sie Mock mit Pytest
Verwenden Sie den Indikator mit pd.merge
Verwenden Sie Gentelella mit Django
Verwenden Sie Mecab mit Python 3
Verwenden Sie Tensorboard mit Chainer
Verwenden Sie DynamoDB mit Python
Verwenden Sie pip mit MSYS2
Verwenden Sie Python 3.8 mit Anaconda
Verwenden Sie Copyright mit Spacemacs
Verwenden Sie Python mit Docker
Verwenden Sie TypeScript mit Django-Kompressor
Verwenden Sie WENIGER mit Django
Verwenden Sie MySQL mit Django
Verwenden Sie Enum mit SQLAlchemy
Verwenden Sie Tensorboard mit NNabla
Verwenden Sie GPS mit Edison
Verwenden Sie nim mit Jupyter
Verwenden Sie mecab-ipadic-neologd von Python
Verwenden Sie die Trello-API mit Python
Verwenden Sie gemeinsam genutzten Speicher mit gemeinsam genutzten Bibliotheken
Verwenden Sie benutzerdefinierte Tags mit PyYAML
Verwenden Sie Richtungsdiagramme mit networkx
Verwenden Sie TensorFlow mit Intellij IDEA
Verwenden Sie die Twitter-API mit Python
Verwenden Sie pip mit Jupyter Notebook
Verwenden Sie DATE_FORMAT mit dem SQLAlchemy-Filter
Verwenden Sie TUN / TAP mit Python
Verwenden Sie sqlite3 mit NAO (Pepper)
Verwenden Sie die load_extensions von sqlite mit Pyramid
Verwenden Sie Windows 10-Schriftarten mit WSL
Verwendung von Chainer mit Jetson TK1
Verwenden Sie SSL mit Sellerie + Redis
Verwenden Sie Cython mit Jupyter Notebook
Verwenden Sie Maxout + CNN mit Pylearn2
Verwenden Sie WDC-433SU2M2 mit Manjaro Linux
Verwenden Sie OpenBLAS mit numpy, scipy
Verwenden Sie die Unterschall-API mit Python3
Verwenden von Sonicwall NetExtener mit Systemd
Verwenden Sie prefetch_related bequem mit Django
Verwenden Sie einen AWS-Interpreter mit Pycharm
Verwenden von Bokeh mit IPython Notebook
Verwenden Sie Python-ähnliche Bereiche mit Rust
Verwenden Sie MLflow mit Databricks ④ - Anrufmodell -
Verwenden Sie pyright mit CentOS7, emacs lsp-mode
Python: So verwenden Sie Async mit
Verwenden der SQL-Datenbank von Azure mit SQL Alchemy
Verwenden Sie eine Point Grey-Kamera mit Python (PyCapture2).
Verwenden Sie vl53l0x mit RaspberryPi (Python)
Verwenden Sie PX-S1UD / PX-Q1UD mit Jetson Nano
Verwenden Sie die Vorschaufunktion mit aws-cli
So verwenden Sie virtualenv mit PowerShell
Verwenden Sie NAIF SPICE TOOL KIT mit Python
Verwenden Sie rospy mit virtualenv in Python3
Markdown mit Jupyter-Notebook verwenden (mit Verknüpfung)