Comment installer MeCab (v0.996) et les bibliothèques pour Python sans privilèges d'administrateur

introduction

Aperçu

Montre comment construire et installer le logiciel d'analyse morphologique MeCab, son dictionnaire et la bibliothèque (liaison) pour Python à partir du code source en tant que ** utilisateur général ** sur une machine Linux ne disposant pas de privilèges d'administrateur. La version MeCab est v0.996, la version Python est 2.7 et le dictionnaire IPA recommandé par le créateur de MeCab est utilisé comme dictionnaire.

Personne cible

Ceux qui peuvent gérer les commandes Linux minimales.

Avertissement

L'auteur n'est pas responsable des dommages causés en se référant à cet article. (Toute responsabilité incombe au lecteur.)

De plus, nous ne garantissons pas la validité du contenu de l'article. S'il y a des points qui doivent être corrigés, veuillez nous le faire savoir dans les commentaires.

procédure

(1) Préparation du fichier source

MeCab: Yet Another Part-of-Speech and Morphological Analyzer

À partir du lien ci-dessus, téléchargez un total de trois fichiers affichés dans la liste ci-dessous. Enregistrez également le fichier téléchargé dans n'importe quel répertoire (ici ~ / src /) directement sous votre répertoire personnel.

  1. mecab-0.996.tar.gz (corps MeCab)
  2. mecab-ipadic-2.7.0-20070801.tar.gz (dictionnaire IPA)
  3. mecab-python-0.996.tar.gz (bibliothèque pour Python)

Le troisième fichier est facultatif et ne doit pas nécessairement être installé, mais les programmes de traitement du langage naturel du livre utilisent souvent MeCab de Python et peuvent être nécessaires pour les exécuter. Il y a. (Bien que des bibliothèques pour d'autres langages tels que Ruby et Java soient disponibles en plus de Python, elles sont omises ici.)

Ensuite, allez dans ~ / src / et décompressez et décompressez le fichier .tar.gz que vous avez téléchargé précédemment.

$ cd ~/src
$ tar zxfv mecab-0.996.tar.gz
$ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zxfv mecab-python-0.996.tar.gz

(2) Installation de l'unité principale MeCab

Lors de l'installation avec les privilèges root, MeCab est installé sous / usr / local / par défaut. Cependant, l'installation échouera avec les privilèges généraux des utilisateurs.

Dans de tels cas, vous pouvez l'installer sous le répertoire souhaité {local} en donnant au script .configure l'option--prefix = {local} ʻ. Veuillez lire la partie de «{local}» selon le cas. Par exemple, dans mon cas, j'ai décidé de créer un répertoire nommélocaldans mon répertoire personnel et d'installer MeCab etc. sous ce répertoire. (Un moyen plus simple de spécifier le répertoire personnel est également courant, mais cette fois j'ai décidé de le mettre sous~ / local` pour éviter que la structure du répertoire ne se complique.)

À ce stade, ** chemin absolu ** doit être spécifié pour «{local}». Un chemin absolu est un chemin emprunté au répertoire racine, tel que / home / {username} / local.

Plus précisément, exécutez la commande suivante. Le code de caractère utilisé par MeCab est spécifié en UTF-8 avec l'option --with-charset.

$ mkdir {local}
$ cd ~/src/mecab-0.996
$ ./configure --prefix={local} --with-charset=utf8
$ make
$ make install

S'il n'y a pas d'erreur, l'installation de MeCab elle-même est terminée.

(3) Installation du dictionnaire IPA

Ensuite, installez le dictionnaire IPA. ** Si vous utilisez MeCab sans le dictionnaire enregistré, une erreur se produira **, alors assurez-vous de le faire.

Exécutez la commande suivante.

$ cd ~/src/mecab-ipadic-2.7.0-20070801
$ ./configure --with-mecab-config={local}/bin/mecab-config --prefix={local} --with-charset=utf8
$ make
$ make install

(4) Définition des variables d'environnement

Ensuite, définissez les variables d'environnement. Voici un exemple de configuration dans le shell C. Modifiez-le en fonction des paramètres existants.

~/.cshrc


    setenv PATH {local}/bin:$PATH

Après avoir enregistré le fichier, fermez l'éditeur de texte pour que les modifications apportées à .cshrc prennent effet.

$ source ~/.cshrc

Ceci termine l'installation de l'ensemble de la MeCab. Pour voir si cela fonctionne, exécutez la commande suivante:

$ mecab
Bonjour, il fait beau aujourd'hui.

Ensuite, les résultats d'analyse morphologique suivants sont obtenus.

Bonjour l'interjection,*,*,*,*,*,Bonjour,Bonjour,Bonjour
, Symbole,Point de lecture,*,*,*,*,、,、,、
Nom aujourd'hui,Avocat possible,*,*,*,*,aujourd'hui,aujourd'hui,Kyo
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Bon adjectif,Indépendance,*,*,Adjectif bon,Forme basique,Bien,bien,bien
Météo,Général,*,*,*,*,Météo,Météo,Météo
Est un verbe auxiliaire,*,*,*,Mort spéciale,Forme basique,est,mort,mort
Assistant Ne,Aide finale,*,*,*,*,Hey,Ne,Ne
.. symbole,Phrase,*,*,*,*,。,。,。
EOS

Lorsque vous voyez la sortie, appuyez sur Ctrl + c pour quitter la commande. Si la sortie est brouillée, il est possible que --with-charset = utf8 n'ait pas été spécifié correctement lors de l'exécution de" ./configure "dans le dictionnaire, ou que le code de caractère du shell soit autre que UTF-8. Il y a. Dans le premier cas, veuillez réinstaller le dictionnaire.

(5) Installation de modules pour Python

Commencez par déplacer le répertoire.

cd ~/src/mecab-python-0.996

Puis réécrivez setup.py dans n'importe quel éditeur de texte. ** Réécrivez tout mecab-config sur les lignes 13,18,19,20 vers {local} / bin / mecab-config. ** **

Exécutez ensuite le script d'installation Python.

$ python setup.py build
$ python setup.py install --prefix={local}

Ensuite, définissez les variables d'environnement. Pour le shell C, ajoutez les deux lignes suivantes à ~ / .cshrc.

~/.cshrc


setenv LD_LIBRARY_PATH {local}/lib:${LD_LIBRARY_PATH}
setenv PYTHONPATH {local}/lib/python2.7/site-packages:${PYTHONPATH}

À ce moment, si une erreur telle que PYTHONPATH: Variable non définie. apparaît, supprimez la partie`: $ {PYTHONPATH} ʻet réessayez, et modifiez-la en fonction de l'environnement existant. * (Veuillez indiquer dans les commentaires s'il existe un meilleur moyen) *

Enregistrez les modifications dans le fichier, fermez l'éditeur de texte, puis reflétez les modifications dans .cshrc.

$ source ~/.cshrc

Le chemin d'accès à la bibliothèque est maintenant en place et MeCab est disponible à partir de Python. Exécutez ~ / src / mecab-python-0.996 / test.py pour vérification.

$ cd ~/src/mecab-python-0.996/
$ python test.py
0.996
Taro substantif,Nomenclature propriétaire,Nom d'une personne,Nom,*,*,Taro,Taro,Taro
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Cet accessoire,*,*,*,*,*,cette,cette,cette
Cette nomenclature,Général,*,*,*,*,Livre,Hong,Hong
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Deux nomenclatures,nombre,*,*,*,*,deux,ré,ré
Ro substantif,Général,*,*,*,*,Ro,Rowe,Faible
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Look verbe,Indépendance,*,*,Un pas,Type continu,à voir,Mi,Mi
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Ta,Ta,Ta
Nomenclature féminine,Général,*,*,*,*,Femme,Josei,Josei
Auxiliaire,Assistant de cas,Général,*,*,*,À,ré,ré
Verbe passant,Indépendance,*,*,Ligne Godan / Sa,Type continu,remettre,je,je
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Ta,Ta,Ta
.. symbole,Phrase,*,*,*,*,。,。,。
EOS

 	BOS/EOS,*,*,*,*,*,*,*,*
Taro substantif,Nomenclature propriétaire,Nom d'une personne,Nom,*,*,Taro,Taro,Taro
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Cet accessoire,*,*,*,*,*,cette,cette,cette
Cette nomenclature,Général,*,*,*,*,Livre,Hong,Hong
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Deux nomenclatures,nombre,*,*,*,*,deux,ré,ré
Ro substantif,Général,*,*,*,*,Ro,Rowe,Faible
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Look verbe,Indépendance,*,*,Un pas,Type continu,à voir,Mi,Mi
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Ta,Ta,Ta
Nomenclature féminine,Général,*,*,*,*,Femme,Josei,Josei
Auxiliaire,Assistant de cas,Général,*,*,*,À,ré,ré
Verbe passant,Indépendance,*,*,Ligne Godan / Sa,Type continu,remettre,je,je
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Ta,Ta,Ta
.. symbole,Phrase,*,*,*,*,。,。,。
 	BOS/EOS,*,*,*,*,*,*,*,*
EOS
EOS
filename: {local}/lib/mecab/dic/ipadic/sys.dic
charset: utf8
size: 392126
type: 0
lsize: 1316
rsize: 1316
version: 102

Si vous obtenez la sortie ci-dessus, l'installation est terminée.

Les références

Recommended Posts

Comment installer MeCab (v0.996) et les bibliothèques pour Python sans privilèges d'administrateur
[Linux] Installez Python 3 sans privilèges d'administrateur
Comment installer et utiliser pandas_datareader [Python]
Comment installer Python
Comment installer python
Comment installer Python pour les chercheurs de sociétés pharmaceutiques
Installer Python et les bibliothèques pour Python sur MacOS Catalina
Python # Comment vérifier le type et le type pour les super débutants
[2020.8 dernière] Comment installer Python
Comment installer Python [Windows]
Comment installer et configurer Blackbird
Comment installer et utiliser Graphviz
Comment installer OpenCV sur Cloud9 et l'exécuter en Python
Comment installer automatiquement le pilote Chrome pour la version Chrome avec Python + Selenium + Chrome
De Python à l'utilisation de MeCab (et CaboCha)
python3 Comment installer un module externe
6 bibliothèques Python pour un développement et un débogage plus rapides
python: Comment utiliser les locals () et globals ()
Comment installer le sous-système Windows pour Linux
Comment utiliser "deque" pour les données Python
[Python] Comment calculer MAE et RMSE
Comment utiliser le zip Python et énumérer
Comment utiliser is et == en Python
Comment installer le tissu et comment l'utiliser
Comment installer python3 avec docker centos
OpenGoddard Comment utiliser la bibliothèque 2-python pour un contrôle optimal non linéaire et la génération de trajectoires
[Version 2020] Comment installer Python3 sur EC2 d'AWS
Comment générer une séquence en Python et C ++
Comment installer OpenCV sur Jetson Nano Python
Conseils pour ceux qui ne savent pas comment utiliser is et == en Python
Comment utiliser la bibliothèque OpenGoddard 3-python pour un contrôle optimal non linéaire et la génération de trajectoires
[Python] Comment lire les données de CIFAR-10 et CIFAR-100
Comment utiliser la bibliothèque OpenGoddard 4-python pour un contrôle optimal non linéaire et la génération de trajectoires
Comment utiliser OAuth et API de compte de service avec le client API Google pour python
[Python] Comment utiliser la fonction de hachage et taple.
[Python] Comment installer OpenCV sur Anaconda [Windows]
Comment rendre le Python des débutants plus rapide [numpy]
Comment installer le détecteur Cascade et comment l'utiliser
Comment utiliser la bibliothèque OpenGoddard 1-python pour un contrôle optimal non linéaire et la génération de trajectoires
Comment tracer l'autocorrélation et l'autocorrélation partielle avec Python
Comment créer un bel environnement Python sur un nouveau Mac et installer Jupter Notebook
Comment installer et utiliser pyenv, que faire si vous ne pouvez pas changer de version de Python
[BigQuery] Comment utiliser l'API de BigQuery pour Python -Création de table-
[Pour les débutants] Comment utiliser la commande say avec python!
[Python] [Django] Comment utiliser le champ de choix et comment ajouter des options
Comment convertir le type Python # pour les super débutants de Python: str
[Pour les débutants] Comment étudier le test d'analyse de données Python3
Liste des bibliothèques Python pour les data scientists et les data ingénieurs
Comment exécuter python dans l'espace virtuel (pour MacOS)
Comment installer Git GUI et Gitk sur CentOS
[Python] Comment trier un dict dans une liste et une instance dans une liste
[Python] Comment fractionner et modulariser des fichiers (simple, exemple)
[Python] Comment créer une matrice de corrélation et une carte thermique
Compilez et installez MySQL-python pour python2.7 sur Amazon Linux
[Introduction à Python] Comment écrire des instructions répétitives à l'aide d'instructions for
Comment installer Nbextensions
Comment installer Prover9
Installez Python (pour Windows)