J'ai fait référence à divers articles sur l'installation de MeCab avec python3. J'ai un tempérament court, donc j'aime les pages qui fonctionnent bien en copiant à partir du haut de la page. «Mendokusai» est une habitude, et «faire sinon» est la devise. (Cela n'a pas d'importance en seconde période.)
CentOS7
Il a été rapide de cloner MeCab.
# git clone https://github.com/taku910/mecab.git
# cd mecab/mecab
# ./configure --enable-utf8-only
# make
# make check
# make install
Vous pouvez télécharger MeCab à partir de la page ci-dessous, mais c'est assez ennuyeux. Il y avait plusieurs MeCabs.
Référence: MeCab https://drive.google.com/drive/folders/0B4y35FiV1wh7fjQ5SkJETEJEYzlqcUY4WUlpZmR4dDlJMWI5ZUlXN2xZN2s2b0pqT3hMbTQ
Si vous n'avez pas de dictionnaire, vous ne pourrez pas l'utiliser, alors installez-le aussi rapidement.
# cd mecab-ipadic
# ./configure --with-charset=utf8
# make
# make install
Une fois l'installation terminée, vous pouvez l'exécuter sur la console, alors essayons-la.
# mecab
MeCab est un logiciel gratuit
MeCab substantif,Nomenclature propriétaire,Organisation,*,*,*,*
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Nomenclature libre,Général,*,*,*,*,gratuit,gratuit,gratuit
Nomenclature des logiciels,Général,*,*,*,*,Logiciel,Logiciel,Logiciel
Est un verbe auxiliaire,*,*,*,Mort spéciale,Forme basique,est,mort,mort
EOS
Ça a marché. C'est un moment de soulagement que le japonais s'affiche sans aucun problème.
C'est là que pip entre en jeu.
# pip install mecab-python3
Sur d'autres sites, il y a des pages qui publient soudainement cette commande. Mais cette commande ne devrait pas non plus fonctionner sans MeCab installé. Il va sans dire que je croyais en la théorie universelle du pip, et quand j'ai vu ce code, j'ai été surpris par pip Hoi Hoi en train de dire: "C'est plus facile!"
Vous pouvez l'installer sans aucun problème.
Écrivons maintenant le fichier python test.py.
#test.py
# coding: UTF-8
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Faites-le vous-même parce que c'est ennuyeux"))
Je vais essayer.
# python test.py
Mendokusai Mendokusai Mendokusai Adjectifs-Adjectif indépendant / Forme de base Auoudan
De Kara à Auxiliaire-Assistant de connexion
Self Jibun Self Noun-Général
De de assistant-Assistant de cas-Général
Make Tsukuru Make verbe-Indépendance 5 étapes, forme de base La line
EOS
Vous pouvez modifier le format de sortie des données en modifiant l'argument de MeCab.Tagger.
-Ochasen -Owakati -Oyomi mecabrc
Il y a d'autres choses comme ça.
#test2.py
# coding: UTF-8
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Faites-le vous-même parce que c'est ennuyeux"))
m = MeCab.Tagger ("-Owakati")
print(m.parse ("Faites-le vous-même parce que c'est ennuyeux"))
m = MeCab.Tagger ("-Oyomi")
print(m.parse ("Faites-le vous-même parce que c'est ennuyeux"))
m = MeCab.Tagger ("mecabrc")
print(m.parse ("Faites-le vous-même parce que c'est ennuyeux"))
Je suis intéressé, alors je vais essayer de l'afficher.
# python test2.py
Mendokusai Mendokusai Mendokusai Adjectifs-Adjectif indépendant / Forme de base Auoudan
De Kara à Auxiliaire-Assistant de connexion
Self Jibun Self Noun-Général
De de assistant-Assistant de cas-Général
Make Tsukuru Make verbe-Indépendance 5 étapes, forme de base La line
EOS
Faites-le vous-même de l'ennui
Mendoku Saikara Jibun Detsukuru
Adjectifs ennuyeux,Indépendance,*,*,apocalypse,Forme basique,Gênant,Ennuyeux,Ennuyeux
De l'assistant,Assistant de connexion,*,*,*,*,De,Kara,Kara
Ma nomenclature,Général,*,*,*,*,moi même,Jibun,Jibun
Auxiliaire,Assistant de cas,Général,*,*,*,alors,De,De
Faire verbe,Indépendance,*,*,Cinq étapes, La ligne,Forme basique,créer,Tsukuru,Tsukuru
EOS
Que faire si on vous dit que vous n'avez pas libmecab.so.2.
ImportError: libmecab.so.2: cannot open shared object file: No such file or directory
approche
$ vi /etc/ld.so.conf.d/lib.conf
/usr/local/lib #<--Remplissez ou ajoutez nouvellement.
$ ldconfig #<--Recharger
Référence: Extraction de mots importants de Wikipedia par TF / IDF en utilisant Mecab Python http://yut.hatenablog.com/entry/20130215/1360884220
Référence: Activer le moteur d'analyse morphologique MeCab dans Python3 (version mars 2016) http://qiita.com/grachro/items/4fbc9bf8174c5abb7bdd#_reference-f17313e8bc66cbbff3ef
Recommended Posts