On suppose que MeCab est installé.
pip install igo-python
mecab-ipadic-neologd
et exécutez. / Bin / install-mecab-ipadic-neologd
. Ensuite, vous aurez un répertoire de construction.dans
mecab-ipadic-neologd / build / mecab-ipadic-2.7.0-20070801-neologd-20150401 et exécutez la commande suivante
java -cp igo- 0.4.5.jar net.reduls.igo.bin.BuildDic neologd. "Utf-8" `C'est tout. Je vais essayer de voir si cela a fonctionné.
Python 2.7.8 (default, Mar 31 2015, 12:51:47)
Type "copyright", "credits" or "license" for more information.
IPython 3.0.0 -- An enhanced Interactive Python.
? -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help -> Python's own help system.
object? -> Details about 'object', use 'object??' for extra details.
In [1]: import igo
In [2]: t = igo.tagger.Tagger('neologd') #Java plus tôt~Chemin du répertoire créé dans
In [3]: for i in t.parse(u'Apple lancera l'Apple Watch sur le marché intérieur le 24 avril.'):
...: print i.surface
...:
Pomme
Est
Apple Watch
À
24 avril
À
National
Libération
Shi
Masu
。
Vous ne pouvez pas obtenir Apple Watch en même temps avec MeCab normal, mais grâce à mecab-ipadic-neologd, vous pouvez l'obtenir. Cette fois, je l'ai exécuté dans le répertoire où neologd a été créé, donc il n'y a pas eu de problème, mais comme je l'ai écrit dans le commentaire, lorsque vous l'utilisez réellement, vous devez passer le chemin vers le répertoire neolog créé.
Ceci est pratique car vous pouvez analyser la morphologie de manière flexible sans installer MeCab.
Dans le répertoire où se trouve igo-0.4.5.jar
java -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic Chemin du répertoire de stockage du dictionnaire mecab-ipadic-neologd chemin vers le répertoire buid Code de caractère
ʻException dans le thread "main" java.lang.OutOfMemoryError: Si vous obtenez une erreur comme l'espace de tas Java, ajoutez
-Xmx1024m` aux options. Je ne connais pas les détails, mais il semble que le tas ne soit pas suffisant, alors j'aimerais le voir en spécifiant la taille.
java -Xmx1024m -cp igo-0.4.5.jar net.reduls.igo.bin.BuildDic neologd . "utf-8"
Je me suis référé à ici, mais j'ai eu la même erreur avec 1024, donc je l'ai doublée en 2048. Puis l'erreur a disparu.
J'ai fait référence à l'article suivant. Merci beaucoup.
Recommended Posts