Activer le moteur d'analyse morphologique MeCab en Python3 (version mars 2016)

Aperçu

Rendre le moteur d'analyse morphologique "MeCab" disponible à partir de Python3 installé dans pyenv sur Mac.

Fondamentalement, le contenu de l'article de résumé existant est le même, mais le référentiel officiel de GitHub a été corrigé, et le travail de correction manuelle dans l'article original consiste simplement à modifier le code de liaison de ~~ Python C'était en bon état. ~~ (2016 / 3/2 revision) Tous ne sont plus nécessaires.

Je viens de compiler les informations de l'article original, mais j'ai réessayé l'installation plusieurs fois, je vais donc laisser les étapes derrière.

Site officiel http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html Référentiel https://github.com/taku910/mecab

Article original

Installation

Installation de MeCab (Wafu bud)

git clone https://github.com/taku910/mecab.git
cd mecab/mecab
./configure  --enable-utf8-only
make
make check
sudo make install

Après l'installation, mecab sera placé.

/usr/local/etc/mecabrc
/usr/local/bin/mecab
/usr/local/bin/mecab-config

~~ Démarrez mecab depuis la console, puis entrez le japonais pour afficher les résultats de l'analyse morphologique. ~~ _2016 / 3/2 postscript Dans la première édition, j'ai écrit l'explication en utilisant la commande mecab ici, mais je ne pouvais pas l'utiliser avant d'avoir installé le dictionnaire. _

Installation de dictionnaires

~~ Téléchargez "Dictionnaire IPA" sur le site officiel. ~~ ~~http://taku910.github.io/mecab/#install~~ ~~http://taku910.github.io/mecab/#download~~

tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install

_2016/3/2 Addendum 2 Veuillez également sauter ici.
Il a été inclus dans le projet git sans le télécharger.
cd ../mecab-ipadic
./configure --with-charset=utf8
make
sudo make install

_2016/3/2 Addendum 2 Ceci est le dernier

À ce stade, démarrez mecab à partir de la console, puis entrez le japonais pour afficher les résultats de l'analyse morphologique.

$ mecab
MeCab est un logiciel gratuit
MeCab substantif,Nomenclature propriétaire,Organisation,*,*,*,*
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Nomenclature libre,Général,*,*,*,*,gratuit,gratuit,gratuit
Nomenclature des logiciels,Général,*,*,*,*,Logiciel,Logiciel,Logiciel
Est un verbe auxiliaire,*,*,*,Mort spéciale,Forme basique,est,mort,mort
EOS

Installation des liaisons Python3

_2016 / 3/2 postscript Il y avait une méthode plus simple que la première édition. Veuillez l'ignorer pendant un moment. _

~~ Ensuite, préparez-vous à utiliser MeCab de Python. Comme les liaisons de divers langages sont préparées dans le répertoire qui a été cloné par git précédemment, déplacez-vous vers le répertoire python. ~~

cd [Répertoire cloné MeCab git]
cd mecab/mecab/python

#2016/3/2 Addendum Veuillez sauter ici

~~ Maintenant, nous devons modifier le code dans setup.py d'une ligne. Veillez à ne pas effacer l'onglet avant le retour. ~~

~~ Cet article "MeCab avec Python 3" ~~

vi setup.py

def cmd2(str):
    return string.split (cmd1(str))

Changé en

def cmd2(str):
    return cmd1(str).split()

#2016/3/2 Addendum Veuillez également sauter ici

~~ Une fois la correction terminée, installez-le. ~~

python setup.py build
sudo python setup.py install

#2016/3/2 Addendum Veuillez également sauter ici

_ PostScript 2016/3/2 _ _ Il y avait une procédure plus simple. Comme décrit dans l'article ci-dessous, vous pouvez l'utiliser à partir de Python 3 avec la commande pip. _

pip install mecab-python3

Essayez d'utiliser

Essayez d'exécuter l 'exemple Python sur le site officiel. L'original est le code pour Python2, donc seule l'impression est modifiée.

import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Je dois le faire aujourd'hui"))

Résultat d'exécution

Aujourd'hui Kyo Aujourd'hui Noun-Avocat possible
Les deux mo et mo-Assistance
Verbe shishi-Indépendance Sahen / Suru
Non Nai Non Verbe auxiliaire Special / Nai Forme de base
Et à et mots auxiliaires-Assistant de connexion
Assistante Nene ne-Aide finale
EOS

Veuillez me faire savoir si la procédure est incorrecte.

Recommended Posts

Activer le moteur d'analyse morphologique MeCab en Python3 (version mars 2016)
[Python] Analyse morphologique avec MeCab
Rendre MeCab disponible à partir de Python 3
Rendre Opencv disponible en Python
Essayez d'utiliser jieba, un moteur d'analyse morphologique chinois
Copiez la liste en Python
Différence dans les résultats de l'analyse morphologique selon le dictionnaire Mecab
Rendre la bibliothèque créée par Eigen of C ++ disponible à partir de Python avec Boost.Numpy.
Text mining avec Python ① Analyse morphologique (re: version Linux)
Collecte d'informations sur Twitter avec Python (analyse morphologique avec MeCab)
Outil d'analyse morphologique en ligne version Pure Python Rakuten MA
Analyse d'association en Python
Analyse de régression avec Python
[Internal_math version (2)] Décodage de la bibliothèque AtCoder ~ Implémentation en Python ~
J'ai créé une classe pour obtenir le résultat de l'analyse par MeCab dans ndarray avec python
Assurez-vous que tous les éléments de la liste sont les mêmes en Python
[Comprendre au plus court] Principes de base de Python pour l'analyse des données
Visualisez la matrice de corrélation par l'analyse des composants principaux avec Python
Analyse morphologique avec Igo + mecab-ipadic-neologd en Python (avec bonus Ruby)
Python: texte japonais: analyse morphologique
Analyse des contraintes symétriques axiales avec Python
Ne faites pas test.py en Python!
Créer un bookmarklet en Python
Méthodes disponibles dans la liste
Analyse morphologique japonaise avec Python
Segfo python en 2 lignes
Analyse de régression simple avec Python
[Python] PCA scratch dans l'exemple de "Introduction à la méthode d'analyse multivariée"
Effectuer une analyse morphologique dans l'environnement d'apprentissage automatique lancé par GCE
De l'introduction de JUMAN ++ à l'analyse morphologique du japonais avec Python
Changer la version active dans Pyenv d'Anaconda en Python ordinaire
python> lien> from __future__ import print_function> Autoriser Python 3.X print () à être utilisé dans Python 2.X
Analyse des ondes cérébrales avec Python: tutoriel Python MNE
Segfo python en une ligne
Obtenir l'API arXiv en Python
Première analyse de régression simple en Python
Mettez MeCab dans "Windows 10; Python3.5 (64 bits)"
Python dans le navigateur: la recommandation de Brython
Enregistrez le fichier binaire en Python
Obtenez le chemin du bureau en Python
pyenv-changer la version python de virtualenv
Carte auto-organisée dans la version Python NumPy
Obtenez le chemin du script en Python
Dans la commande python, python pointe vers python3.8
Implémenter le modèle Singleton en Python
Rendre la sortie standard non bloquante en Python
Comment obtenir la version Python
Text mining avec Python ① Analyse morphologique
Windows10: Installation de la bibliothèque MeCab pour python
[Python] Faire de la fonction une fonction lambda
■ [Google Colaboratory] Utiliser l'analyse morphologique (MeCab)
Accédez à l'API Web en Python
Segfo python en trois lignes
J'ai écrit la file d'attente en Python
Calculer le mois précédent en Python
[Lambda] Activer les demandes d'importation [python]
Examiner la classe d'un objet avec python
Analyse du squelette planaire dans Python (2) Hotfix
Obtenez le chemin du bureau en Python