Utilisez mecab-ipadic-neologd avec igo-python

On suppose que MeCab est installé.

procédure

  1. Installez igo-python pip install igo-python
  2. Téléchargez igo-0.4.5.jar
  3. Téléchargez mecab-ipadic-neologd (git clone)
  4. Allez dans mecab-ipadic-neologd et exécutez. / Bin / install-mecab-ipadic-neologd. Ensuite, vous aurez un répertoire de construction.
  5. Copiez ʻigo-0.4.5.jardansmecab-ipadic-neologd / build / mecab-ipadic-2.7.0-20070801-neologd-20150401 et exécutez la commande suivante java -cp igo- 0.4.5.jar net.reduls.igo.bin.BuildDic neologd. "Utf-8" `

C'est tout. Je vais essayer de voir si cela a fonctionné.

Python 2.7.8 (default, Mar 31 2015, 12:51:47)
Type "copyright", "credits" or "license" for more information.

IPython 3.0.0 -- An enhanced Interactive Python.
?         -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help      -> Python's own help system.
object?   -> Details about 'object', use 'object??' for extra details.

In [1]: import igo

In [2]: t  = igo.tagger.Tagger('neologd')  #Java plus tôt~Chemin du répertoire créé dans

In [3]: for i in t.parse(u'Apple lancera l'Apple Watch sur le marché intérieur le 24 avril.'):
   ...:     print i.surface
   ...:
Pomme
Est
Apple Watch
À
24 avril
À
National
Libération
Shi
Masu
。

Vous ne pouvez pas obtenir Apple Watch en même temps avec MeCab normal, mais grâce à mecab-ipadic-neologd, vous pouvez l'obtenir. Cette fois, je l'ai exécuté dans le répertoire où neologd a été créé, donc il n'y a pas eu de problème, mais comme je l'ai écrit dans le commentaire, lorsque vous l'utilisez réellement, vous devez passer le chemin vers le répertoire neolog créé.

Ceci est pratique car vous pouvez analyser la morphologie de manière flexible sans installer MeCab.

point important

Explication des commandes de compilation d'un dictionnaire pour igo

Dans le répertoire où se trouve igo-0.4.5.jar java -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic Chemin du répertoire de stockage du dictionnaire mecab-ipadic-neologd chemin vers le répertoire buid Code de caractère

Erreur lors de la compilation du dictionnaire pour igo

ʻException dans le thread "main" java.lang.OutOfMemoryError: Si vous obtenez une erreur comme l'espace de tas Java, ajoutez -Xmx1024m` aux options. Je ne connais pas les détails, mais il semble que le tas ne soit pas suffisant, alors j'aimerais le voir en spécifiant la taille.

java -Xmx1024m -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic neologd . "utf-8"

Je me suis référé à ici, mais j'ai eu la même erreur avec 1024, donc je l'ai doublée en 2048. Puis l'erreur a disparu.

référence

J'ai fait référence à l'article suivant. Merci beaucoup.

Recommended Posts

Utilisez mecab-ipadic-neologd avec igo-python
Utilisez RTX 3090 avec PyTorch
Utiliser ansible avec cygwin
Utiliser pipdeptree avec virtualenv
[Python] Utiliser JSON avec Python
Utilisez Mock avec pytest
Utiliser l'indicateur avec pd.merge
Utiliser Gentelella avec Django
Utiliser mecab avec Python 3
Utiliser tensorboard avec Chainer
Utiliser DynamoDB avec Python
Utiliser pip avec MSYS2
Utilisez Python 3.8 avec Anaconda
Utiliser les droits d'auteur avec Spacemacs
Utiliser python avec docker
Utiliser TypeScript avec django-compresseur
Utilisez LESS avec Django
Utiliser MySQL avec Django
Utiliser Enum avec SQLAlchemy
Utiliser tensorboard avec NNabla
Utiliser le GPS avec Edison
Utilisez nim avec Jupyter
Utilisez mecab-ipadic-neologd de Python
Utiliser l'API Trello avec python
Utiliser la mémoire partagée avec une bibliothèque partagée
Utiliser des balises personnalisées avec PyYAML
Utiliser des graphiques directionnels avec networkx
Utiliser TensorFlow avec Intellij IDEA
Utiliser l'API Twitter avec Python
Utiliser pip avec Jupyter Notebook
Utiliser DATE_FORMAT avec le filtre SQLAlchemy
Utiliser TUN / TAP avec Python
Utilisez sqlite3 avec NAO (Pepper)
Utilisez les load_extensions de sqlite avec Pyramid
Utiliser les polices Windows 10 avec WSL
Utilisation du chainer avec Jetson TK1
Utiliser SSL avec Celery + Redis
Utiliser Cython avec Jupyter Notebook
Utilisez Maxout + CNN avec Pylearn2
Utilisez WDC-433SU2M2 avec Manjaro Linux
Utilisez OpenBLAS avec numpy, scipy
Utiliser l'API subsonique avec python3
Utilisation de Sonicwall NetExtener avec Systemd
Utilisez prefetch_related commodément avec Django
Utiliser l'interpréteur AWS avec Pycharm
Utilisation de Bokeh avec IPython Notebook
Utiliser une plage de type Python avec Rust
Utiliser MLflow avec Databricks ④ --Call model -
Utiliser pyright avec CentOS7, emacs lsp-mode
Python: comment utiliser async avec
Utilisation de la base de données SQL d'Azure avec SQL Alchemy
Utiliser la caméra Point Grey avec Python (PyCapture2)
Utilisez vl53l0x avec RaspberryPi (python)
Utilisez PX-S1UD / PX-Q1UD avec Jetson nano
Utilisez la fonction de prévisualisation avec aws-cli
Pour utiliser virtualenv avec PowerShell
Utilisez NAIF SPICE TOOL KIT avec Python
Utiliser rospy avec virtualenv dans Python3
Utiliser Markdown avec le notebook Jupyter (avec raccourci)