[PYTHON] Chargez NEologd depuis MeCab si vous ne disposez pas des privilèges d'installation (Windows)

introduction

Je voulais ajouter le dictionnaire NEologd à MeCab, mais je n'ai pas pu l'installer car je n'avais pas l'autorisation. Notez comment lire dans le dictionnaire utilisateur

environnement

Windows 10 64bit MeCab 0.996 32bit

Procédure d'installation de NEologd

Installez NEologd

Téléchargez NEologd à partir de l'URL suivante https://github.com/neologd/mecab-ipadic-neologd

Compilation de fichiers csv

Préparation du fichier csv

Dans le dossier de départ du fichier mecab-ipadic-neologd-master téléchargé Il existe un fichier csv solidifié, alors décompressez-le Chacun est un fichier de dictionnaire MeCab, alors décompressez uniquement le fichier csv que vous souhaitez lire

Compilation de fichiers csv

Après avoir préparé le fichier csv Compilez le fichier csv en entrant la commande suivante à l'invite de commande

"C:\Program Files (x86)\MeCab\bin\mecab-dict-index" -d "C:\Program Files(x86)\MeCab\dic\ipadic" -u <Où vous souhaitez placer votre dictionnaire utilisateur\Nom du dictionnaire utilisateur.dic> -f utf-8 -t utf-8 <Emplacement du fichier csv\nom de fichier csv.csv>

Lire le dictionnaire utilisateur de MeCab

Lors de la lecture d'un dictionnaire utilisateur depuis MeCab avec un fichier Python Lorsque vous utilisez Tagger, spécifiez le dictionnaire utilisateur avec l'option -u comme indiqué ci-dessous. Plusieurs dictionnaires utilisateur peuvent être spécifiés avec, (virgule)


import MeCab
m = MeCab.Tagger("-u hoge.dic,fuga.dic")

référence

Recommended Posts

Chargez NEologd depuis MeCab si vous ne disposez pas des privilèges d'installation (Windows)
[Linux] Vous ne disposez pas des privilèges root. Mais je veux yum installer.
Que faire si vous êtes accro aux codes de caractères Windows
Si vous êtes bloqué dans Impossible de charger mkl_intel_thread.dll en Python sous Windows
Que faire si vous avez installé PyCharm mais que les touches de raccourci telles que `control + e` ne fonctionnent pas