Installez Mecab et mecab-python3 sur Ubuntu 14.04

Aperçu

Mecab est un moteur d'analyse morphologique open source. Il peut être utilisé pour diviser des phrases japonaises comme préparation à l'apprentissage automatique. Le but de cet article est d'installer Mecab et de le rendre disponible depuis Python.

environnement

Procédure d'installation

  1. Mecab

J'ai fait référence à cet article.

$ sudo apt-get install mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8

(Je ne sais pas si j'ai besoin à la fois de mecab-ipadic et de mecab-ipadic-utf8, mais cela semble fonctionner pour le moment)

Vous pouvez voir le résultat de l'analyse morphologique en exécutant la commande mecab et en saisissant des phrases japonaises. Par exemple, le résultat de l'entrée "Premier ministre Shinzo Abe" est le suivant.

$ mecab
Premier ministre Shinzo Abe
Abe substantif,Nomenclature propriétaire,Nom d'une personne,Nom de famille,*,*,Abe,Abe,Abe
Jin substantif,Nomenclature propriétaire,Nom d'une personne,Nom,*,*,Jin,Susumu,Susumu
Trois nomenclature,nombre,*,*,*,*,Trois,Soleil,Soleil
Nomenclature du premier ministre,Général,*,*,*,*,premier ministre,Shusho,Shusho
EOS

"Shinzo" n'a pas été analysé correctement.

  1. mecab-ipadic-NEologd

Le dictionnaire IPA par défaut semble vulnérable à une analyse de nomenclature appropriée, nous avons donc considérablement amélioré la nomenclature appropriée et d'autres nouveaux mots [mecab-ipadic-NEologd](https://github.com/neologd/mecab-ipadic-neologd/ Entrez un dictionnaire appelé blob / master / README.ja.md).

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n -a

Editez / etc / mecabrc pour le spécifier comme dictionnaire par défaut

dicdir = /usr/lib/mecab/dic/mecab-ipadic-neologd

ça ira.

Consultez la documentation officielle (https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md) pour plus d'informations.

De même, analysons le "Premier ministre Shinzo Abe".

$ mecab -d                              
Premier ministre Shinzo Abe
Nominal du Premier ministre Shinzo Abe,Nomenclature propriétaire,Général,*,*,*,Shinzo Abe,Abe Shinzo Shusho,Spectacle Abe Shinzosh
EOS

Cette fois, il est correctement reconnu comme une nomenclature appropriée.

mecab-python3

Incluez la liaison Mecab pour Python 3.

$ pip install mecab-python3

C'est acceptable.

mecab-test3


import sys
import MeCab
m = MeCab.Tagger("-Ochasen")
print(m.parse("Le Premier ministre Shinzo Abe a prononcé un discours politique à la Diète."))

Quand tu cours

$ python mecab-test.py 
Premier ministre Shinzo Abe Shinzo Abe Shinzo Abe Shinzo Nominal-Nomenclature propriétaire-Général
Ha ha est un assistant-Assistance
,,, symbole-Point de lecture
Parlement Kokkai Nomenclature du Parlement-Général
De de assistant-Assistant de cas-Général
Discours politique Shisei Houshin Enzetsu Discours politique Nominal-Nomenclature propriétaire-Général
Wo wo auxiliaire-Assistant de cas-Général
Go Okonatsu Do verbe-Ligne indépendante à cinq étages / wa permettant une connexion continue du service sonore
Ta ta ta verbe auxiliaire special ta ta forme de base
.. .. .. symbole-Phrase
EOS

Ce sera.

Si vous souhaitez écrire séparément

m = MeCab.Tagger("-Owakati")

Tu peux le faire.

mecab-wakati-test.py


import sys
import MeCab
m = MeCab.Tagger("-Owakati")
items = m.parse("Le Premier ministre Shinzo Abe a prononcé un discours politique à la Diète.")
print(items)
print(type(items))

Quand tu cours

$ python mecab-wakati-test.py          
Le Premier ministre Shinzo Abe a prononcé un discours politique à la Diète.

<class 'str'>

Le résultat est renvoyé sous forme de chaîne, donc si vous voulez en faire une liste, vous pouvez faire split ().

Recommended Posts

Installez Mecab et mecab-python3 sur Ubuntu 14.04
Installez et exécutez Dropbox sur Ubuntu 20.04
Installez OpenCV et Chainer sur Ubuntu
Installez CUDA 8.0 et Chainer sur Ubuntu 16.04
Installez le fabric sur Ubuntu et essayez
Installez Puppet Master and Client sur Ubuntu 16.04
Installez pyenv et Python 3.6.8 sur Ubuntu 18.04 LTS
Installer mecab sur Marvericks
Installez TensorFlow sur Ubuntu
Installez PySide2 sur Ubuntu
Installez JModelica sur Ubuntu
Installez mecab-python sur CentOS
Installez Python 3.3 sur Ubuntu 12.04
Installez Theano sur Ubuntu 12.04
Installer mecab sur Mac
Installez angr sur Ubuntu 18.04
installer mecab-python sur Mac
Installez pip / pip3 sur Ubuntu
Installez MongoDB sur Ubuntu 16.04 et utilisez python
Installez OpenCV sur Ubuntu + python
wsl Installer PostgreSQL sur Ubuntu 18.04
[ROS] Installer ROS (mélodique) sur Ubuntu (18.04)
Installez Caffe sur Ubuntu 14.04 (GPU)
Installer Docker sur WSL Ubuntu 18.04
Installez Apache 2.4 sur Ubuntu 19.10 Eoan Ermine et exécutez CGI
Installez CUDA10.1 + cuDNN7.6.5 + tensorflow-2.3.0 sur Ubuntu 18.04
Installez Python 3.8 sur Ubuntu 18.04 (norme du système d'exploitation)
Installez Caffe sur Ubuntu 14.04 (mode CPU)
Installez Python 3.8 sur Ubuntu 20.04 (norme du système d'exploitation)
Construisez et installez OpenCV sur Windows
Installer python3 et autour de la bibliothèque de calcul scientifique sur Ubuntu (virtualenv + pip)
Installez Python 3.9 sur Ubuntu 20.04 (norme du système d'exploitation?)
Installez confluent-kafka pour Python sur Ubuntu
Installez Python 2.7 sur Ubuntu 20.04 (norme du système d'exploitation?)
Etude ROS # 1 Installation de ros-noetic sur Ubuntu 20.04
Installez easy_install et pip sur Windows
Installez mecab sur le serveur partagé Sakura et appelez-le depuis python
Installez Ubuntu 18.04 sur le modèle de la barre tactile MacBook Pro et connectez-vous au WIFI
Créer un environnement Python 3 et OpenCV sur Ubuntu 18.04
Installez wsl2 et master linux sous Windows
Environnement virtuel Python et packages sur Ubuntu
Étapes pour installer l'environnement Python sur Ubuntu
Installer et lancer k3s sur Manjaro Linux
Installer et configurer le serveur TigerVNC sous Linux
Installez Pleasant sur Ubuntu 20.04 (version .NetCore3.1 / PostgreSQL)
Installez ubuntu sur un ordinateur portable UEFI Ultra 32 bits
Installez Caffe exécutant 3D-CNN sur un Ubuntu 14.04 propre
Comment installer php7.4 sur Linux (Ubuntu)
Installez pyenv et rbenv à l'échelle du système sur CentOS
Shebang sur Ubuntu 20.04
Gérer les images Django et les actifs statiques sur Ubuntu
Installer matplotlib et afficher le graphique dans Jupyter Notebook
Dask ne peut pas être installé sur Ubuntu avec pip
Installez et exécutez Python3.5 + NumPy + SciPy sur Windows 10
Installer le package python dans l'environnement personnel sur Ubuntu
[Mémo de procédure] Installez Python3 + OpenSSL localement sur Ubuntu
[Note] Installez wxPython 3.x sur Linux Mint (Ubuntu)