[Python] Analyse morphologique avec MeCab

Puisque l'analyse morphologique peut être utilisée pour le prétraitement des données utilisées pour la PNL, elle est résumée.

Qu'est-ce que MeCab?

Un moteur d'analyse morphologique japonais open source.

Développé par Taku Kudo, un ingénieur logiciel actuel de Google et l'un des développeurs d'entrées japonais de Google. Le nom est tiré du favori du développeur "Wafubu".

Cité de Wikipedia

environnement

Installation

Installez MeCab lui-même.

$ brew install mecab

Installez le dictionnaire MeCab.

$ brew install mecab-ipadic

Vérifiez si MeCab est installé.

$ mecab --version
mecab of 0.996

Essayons l'analyse morphologique.

$ mecab
Essayons l'analyse morphologique.
Essai substantif,Général,*,*,*,*,procès,Tamesh,Tamesh
Auxiliaire,Assistant de cas,Général,*,*,*,À,ré,ré
Nomenclature morphologique,Général,*,*,*,*,morphème,Keitaiso,Keitaiso
Nom analytique,Changer de connexion,*,*,*,*,une analyse,Kaiseki,Kaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS

Le mot ** analyse morphologique ** a été décomposé en ** éléments morphologiques ** et ** analyse **. Pour résoudre ce problème, installez le dernier dictionnaire ** mecab-ipadic-NEologd **. Tout d'abord, clonez les données du dictionnaire à partir de GitHub.

$ git clone --depth 1 [email protected]:neologd/mecab-ipadic-neologd.git

Accédez au référentiel cloné, exécutez l'installation et sélectionnez Oui sur l'écran de confirmation.

$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
yes

Spécifiez le dictionnaire avec l'option -d et réessayez l'analyse morphologique.

$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
Essayons l'analyse morphologique.
Complément d'essai,Général,*,*,*,*,Comme test,Tameshini,Tameshini
Nomenclature d'analyse morphologique,Nomenclature propriétaire,Général,*,*,*,Analyse morphologique,Keitaisokaiseki,Keitaisokaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS

En toute sécurité, c'est devenu un mot ** analyse morphologique **.

Utilisé en Python

Installez la bibliothèque pour python.

pip3 install mecab-python3

Après cela, écrivez le code et essayez-le.

import MeCab

mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')
print(mecab.parse('Essayons l'analyse morphologique.'))


Complément d'essai,Général,*,*,*,*,Comme test,Tameshini,Tameshini
Nomenclature d'analyse morphologique,Nomenclature propriétaire,Général,*,*,*,Analyse morphologique,Keitaisokaiseki,Keitaisokaiseki
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Verbe shi,Indépendance,*,*,Sahen / Suru,Type continu,Faire,Shi,Shi
Te assistant,Assistant de connexion,*,*,*,*,main,Te,Te
Verbe miru,Non indépendant,*,*,Un pas,Forme basique,Vue,moulin,moulin
.. symbole,Phrase,*,*,*,*,。,。,。
EOS

Recommended Posts

[Python] Analyse morphologique avec MeCab
Analyse morphologique japonaise avec Python
Text mining avec Python ① Analyse morphologique
J'ai joué avec Mecab (analyse morphologique)!
Collecte d'informations sur Twitter avec Python (analyse morphologique avec MeCab)
Analyse de données avec python 2
Utiliser mecab avec Python 3
Analyse vocale par python
Analyse des tweets avec Python, Mecab et CaboCha
Analyse vocale par python
Python: analyse morphologique simplifiée avec des expressions régulières
Analyse de données avec Python
[Analyse de co-occurrence] Analyse de co-occurrence facile avec Python! [Python]
Python: texte japonais: analyse morphologique
Analyse des émotions par Python (word2vec)
Analyse de squelette planaire avec Python
Analyse des secousses musculaires avec Python
[PowerShell] Analyse morphologique avec SudachiPy
Text mining avec Python ① Analyse morphologique (re: version Linux)
Analyse de la structure du squelette en trois dimensions avec Python
Analyse d'impédance (EIS) avec python [impedance.py]
■ [Google Colaboratory] Utiliser l'analyse morphologique (MeCab)
Analyse de données à partir de python (visualisation de données 1)
Analyse de régression logistique Self-made avec python
Lors de l'utilisation de MeCab avec python dans virtualenv
Analyse de données à partir de python (visualisation de données 2)
Analyse morphologique avec Igo + mecab-ipadic-neologd en Python (avec bonus Ruby)
FizzBuzz en Python3
Grattage avec Python
Statistiques avec python
[Didacticiel d'analyse Python en base de données avec SQL Server 2017]
Analyse bidimensionnelle du flux de perméation saturée-insaturée avec Python
Grattage avec Python
Python avec Go
Analyse de données python
Utilisation de Python et MeCab avec Azure Databricks
Apprentissage automatique avec python (2) Analyse de régression simple
Activer le moteur d'analyse morphologique MeCab en Python3 (version mars 2016)
Programme d'analyse des contraintes FEM 2D par Python
Twilio avec Python
Intégrer avec Python
Jouez avec 2016-Python
AES256 avec python
Testé avec Python
python commence par ()
avec syntaxe (Python)
MeCab de Python
Bingo avec python
Zundokokiyoshi avec python
Analyse de données à partir de python (pré-traitement des données-apprentissage automatique)
De l'introduction de JUMAN ++ à l'analyse morphologique du japonais avec Python
Analyse de conduction thermique bidimensionnelle non stationnaire avec Python
Utiliser Python et MeCab avec Azure Functions
Excel avec Python
Micro-ordinateur avec Python
Cast avec python
De la préparation à l'analyse morphologique avec python en utilisant polyglotte au marquage des mots partiels
[Jouons avec Python] Viser la génération automatique de phrases ~ Effectuer une analyse morphologique ~
[Diverses analyses d'images avec plotly] Visualisation dynamique avec plotly [python, image]