[PYTHON] Ajouter un dictionnaire à MeCab

Je suis désolé, je suis un débutant pour publier sur Qiita, donc je pense que la mise en page est étrange. Je vous serais reconnaissant de bien vouloir me donner quelques conseils sur la mise en page et l’écriture.

【Aperçu】

Procédure pour ajouter un nouveau mot (dictionnaire utilisateur) à MeCab

【environnement】

Mac OS X

【Remarques】

  1. On suppose que MeCab est installé
  2. Le répertoire dans lequel le dictionnaire MeCab est stocké diffère en fonction de l'environnement, vérifiez donc l'emplacement de chaque répertoire (dans la plupart des cas, il se trouve dans / usr / local / lib / mecab / dic / ipadic).
  3. Si vous ne réécrivez pas macabrc, vous devez transmettre le chemin à chaque fois que vous exécutez le dictionnaire utilisateur (mecab -u user.dic). Ouvrez / usr / local / etc / mecabrc avec un éditeur et réécrivez comme suit
 userdic	= /usr/local/lib/mecab/dic/ipadic/user.dic(la gauche;Effacer)

[Description du fichier]

1.create_dic.py (pour Python 3.X, un programme pour créer newword_dic.csv à partir de newword_list.txt)

create_dic.py


if __name__ == "__main__":
        fin = open("newword_list.txt")
        fout = open("newword_dic.csv","w")
        for line in fin:
                line=line.rstrip('\n')
                word = line.split(',')
                cost = int(max(-36000, -400*len(word[0])**1.5))
                fout.write("%s,-1,-1,%d,nom,Général,*,*,*,*,*,*,%s,%s\n" % (word[0],cost,word[1],word[1]))
        fin.close()
        fout.close()

2.newword_list.txt (Liste contenant de nouveaux mots. Fondamentalement, seul ce fichier texte peut être édité)

Sword Art Online, Sword Art Onrain L'humanité a décliné, l'humanité a décliné Magical Girl Lyrical Nanoha, Magical Girl Lyrique Nanoha Intelligence artificielle, intelligence artificielle

  1. newword_dic.csv (dictionnaire de format MeCab)

スクリーンショット 2016-10-07 14.07.13.png

【procédure】

  1. Ajoutez un nouveau mot à newword_list.txt comme indiqué dans l'exemple (Exemple: Magical Girl Lyrical Nanoha, Mahou Shojo Rikaru Nanoha)
  2. Créez un dictionnaire MeCab (newword_dic.csv) à partir de newword_list.txt
  python create_dic.py
  1. Compilez newword_dic.csv dans un format (.dic) qui peut être utilisé avec MeCab et ajoutez-le au dictionnaire.
  sudo /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 newword_dic.csv
  1. Déplacez le dictionnaire ajouté dans le répertoire où se trouve le dictionnaire système MeCab.
  sudo mv user.dic /usr/local/lib/mecab/dic/ipadic
  1. Démarrez mecab depuis le terminal   スクリーンショット 2016-10-07 14.13.03.png

Si tel est le cas, le dictionnaire utilisateur est correctement ajouté à MeCab

Les références

http://tseiya.hatenablog.com/entry/2012/09/19/191114

Recommended Posts

Ajouter un dictionnaire à MeCab
Ajouter un dictionnaire utilisateur à MeCab
[Analyse morphologique] Comment ajouter un nouveau dictionnaire à Mecab
MeCab: ajouter de nouveaux mots au dictionnaire défini par l'utilisateur (Windows)
Pour ajouter un module C à MicroPython ...
Metaclass (wip) pour générer un dictionnaire
Ajoutez une carte GPIO à votre ordinateur. (1)
Comment ajouter un package avec PyCharm
Différentes façons de créer un dictionnaire (mémoires)
Script pour créer un fichier de dictionnaire Mac
Ajouter un environnement virtuel Python à VSCode
Ajouter une commande pour marquer ensemble des fichiers similaires
Comment créer un dictionnaire avec une structure hiérarchique.
Comment ajouter un chemin de recherche de module Python
Générer un dictionnaire MeCab à partir des données de l'Encyclopédie Nico Nico
Pour ajouter un module à python que vous mettez dans Julialang
[Wagtail] Ajouter une page de connexion au projet Wagtail
Ajouter une convolution à MNIST
Comment utiliser le dictionnaire {}
Accès aux champs du dictionnaire
Comment convertir un objet de classe en dictionnaire avec SQLAlchemy
Comment écrire un type liste / dictionnaire de Python3
Générer un script bash pour ajouter les paramètres du moniteur Datadog
Introduction à l'algorithme de recherche de dictionnaire
[Django] Pattern pour ajouter des enregistrements associés après avoir créé un enregistrement
Créer un dictionnaire en Python
Ajouter / supprimer un noyau à JupyterLab
Utilisez MeCab pour récupérer les lectures
Une route vers Python intermédiaire
Une super introduction à Linux
Comment convertir un tableau en dictionnaire avec Python [Application]
Comment appeler une fonction
Ajouter un numéro de page au PDF
Télécharger un fichier sur Dropbox
Envoyer un signal au sous-processus
Ajoutez une fonction à heatrapy qui peut transférer chaleur + chaleur à température
Utilisez MeCab pour traduire des phrases bâclées de manière "lente".
Fonction pratique pour ajouter des colonnes n'importe où dans Pandas DataFrame
Comment pirater un terminal
La façon habituelle d'ajouter un noyau avec Jupyter Notebook
Essayez de sélectionner une langue
Un moyen relativement simple d'insérer un dictionnaire NEologd dans le dictionnaire Windows-System
Développez un dictionnaire imbriqué Python pour faire quelque chose comme MultiIndex de Pandas
[Python] Comment ajouter des lignes et des colonnes à une table (pandas DataFrame)
Comment vérifier la taille de la mémoire d'un dictionnaire en Python
Essayez de dessiner une courbe de Bézier
Remarques sur l'exécution d'Errbot localement
Ajouter des champs à des entités avec ArcPy
Convertir un PDF A4 en A3 toutes les 2 pages
Étapes pour créer un projet Django
Ajouter le ratio cumulatif à l'histogramme matplotlib
Un mémorandum pour passer à Manjaro Linux
Créer un dictionnaire imbriqué à l'aide de defaultdict
Comment créer un bot slack
Comment créer un package Conda
Écrire la sortie standard dans un fichier
Python 2.7 Ajout de la documentation japonaise à Dash.app