Puisque l'analyse morphologique peut être utilisée pour le prétraitement des données utilisées pour la PNL, elle est résumée.
Un moteur d'analyse morphologique japonais open source.
Développé par Taku Kudo, un ingénieur logiciel actuel de Google et l'un des développeurs d'entrées japonais de Google. Le nom est tiré du favori du développeur "Wafubu".
Installez MeCab lui-même.
$ brew install mecab
Installez le dictionnaire MeCab.
$ brew install mecab-ipadic
Vérifiez si MeCab est installé.
$ mecab --version
mecab of 0.996
Essayons l'analyse morphologique.
$ mecab
Essayons l'analyse morphologique.
Essai substantif,Général,*,*,*,*,procès,Tamesh,Tamesh
Auxiliaire,Assistant de cas,Général,*,*,*,À,ré,ré
Nomenclature morphologique,Général,*,*,*,*,morphème,Keitaiso,Keitaiso
Nom analytique,Changer de connexion,*,*,*,*,une analyse,Kaiseki,Kaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS
Le mot ** analyse morphologique ** a été décomposé en ** éléments morphologiques ** et ** analyse **. Pour résoudre ce problème, installez le dernier dictionnaire ** mecab-ipadic-NEologd **. Tout d'abord, clonez les données du dictionnaire à partir de GitHub.
$ git clone --depth 1 [email protected]:neologd/mecab-ipadic-neologd.git
Accédez au référentiel cloné, exécutez l'installation et sélectionnez Oui sur l'écran de confirmation.
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
yes
Spécifiez le dictionnaire avec l'option -d et réessayez l'analyse morphologique.
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
Essayons l'analyse morphologique.
Complément d'essai,Général,*,*,*,*,Comme test,Tameshini,Tameshini
Nomenclature d'analyse morphologique,Nomenclature propriétaire,Général,*,*,*,Analyse morphologique,Keitaisokaiseki,Keitaisokaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS
En toute sécurité, c'est devenu un mot ** analyse morphologique **.
Installez la bibliothèque pour python.
pip3 install mecab-python3
Après cela, écrivez le code et essayez-le.
import MeCab
mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')
print(mecab.parse('Essayons l'analyse morphologique.'))
Complément d'essai,Général,*,*,*,*,Comme test,Tameshini,Tameshini
Nomenclature d'analyse morphologique,Nomenclature propriétaire,Général,*,*,*,Analyse morphologique,Keitaisokaiseki,Keitaisokaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS
Recommended Posts