Installieren Sie mecab auf dem gemeinsam genutzten Sakura-Server und rufen Sie es von Python aus auf

Überblick

In diesem Artikel Installieren Sie mecab mit UTF-8 auf dem gemeinsam genutzten Sakura-Server. Rufen Sie danach Mecab von Python aus auf und versuchen Sie es mit einer morphologischen Analyse. Dem Sakura-Mietserver werden daher keine Root-Rechte gewährt Installieren Sie im Benutzerverzeichnis.

Voraussetzungen

-Die Befehle in der Prozedur werden in bash beschrieben. Wie man zu Bash wechselt Überprüfen Sie die Ergänzung "Bash auf Sakura-Mietserver standardisieren"!

Was zu installieren

・ Mecab-Körper (Mecab-0,996) ・ Mecab-Wörterbuch ・ Python-Paketverwaltungssystem pip ・ Mecab-Python

Verfahren

Installation des Mecab-Körpers

(1) Laden Sie den Mecab-Körper von der folgenden Website herunter. http://taku910.github.io/mecab/#download

(2) Entpacken Sie den Mecab-Körper Entpacken Sie den Body mit dem Befehl tar tar xvfz ./mecab-0.996.tar.gz

(3) Wechseln Sie in das entpackte Verzeichnis cd mecab-0.996

(4) Kompilieren und erstellen Geben Sie den folgenden Befehl ein, der im Benutzerverzeichnis installiert werden soll ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only

make make install

In meiner Umgebung wurde es am folgenden Speicherort installiert. ~/local/bin/mecab

(5) Überprüfen Sie, ob es installiert ist mecab -v Wenn es normal installiert ist, können Sie den obigen Befehl eingeben und es wird "mecab of 0.996" angezeigt. Ein solches Protokoll wird angezeigt.

Fügen Sie das ipa-Wörterbuch ein

(1) Laden Sie das Mecab-Wörterbuch und das IPA-Wörterbuch von den folgenden Websites herunter. http://taku910.github.io/mecab/#download

(2) Entpacken Sie das ipa-Wörterbuch tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz

(3) Wechseln Sie in den Wörterbuchordner cd mecab-ipadic-2.7.0-20070801

(4) Geben Sie den folgenden Befehl ein, der im Benutzerverzeichnis installiert werden soll Der Zeichencode des Wörterbuchs lautet utf-8. Der Grund für die Verwendung von utf-8 besteht darin, es im WEB aufzurufen. ./configure --with-charset=utf8

Selbst wenn Sie es hier auf utf-8 setzen, nachdem Sie mecab ausgeführt haben, Der Zeichencode des Ausgabeergebnisses kann EUC bleiben.

In diesem Fall in "mecab-ipadic-2.7.0-20070801" Konvertiert Dateien mit den Erweiterungen "csv" und "def" in UTF-8 und überschreibt sie.

Befehl zum Konvertieren in UTF-8 und Befehl zum Bestätigen nkf -w --overwrite *.csv nkf -w --overwrite *.def nkf --guess *.*

Referenz Verwendung von Mecab mit dem gemeinsam genutzten Sakura-Server, UTF-8-Wörterbuch http://nymemo.com/sakura/258/

(5) Kompilieren und erstellen Geben Sie den folgenden Befehl ein, der im Benutzerverzeichnis installiert werden soll

make make install

In meiner Umgebung wurde das Wörterbuch am folgenden Speicherort installiert. ~/local/lib/mecab/dic/ipadic

Funktionsprüfung des Mecab

Geben Sie das Wörterbuch wie unten gezeigt an und starten Sie mecab.

mecab -d ~/local/lib/mecab/dic/ipadic Die Terminaleinstellung ist UTF-8.

Bei Erfolg wird Folgendes angezeigt.

[home@www1635 ~/local/etc]$ mecab -d ~/local/lib/mecab/dic/ipadic Von den Oberschenkeln und Oberschenkeln Sumomo-Nomenklatur, allgemein, *, *, *, *, Sumomo, Sumomo, Sumomo Mo Assistent, Angestellter, *, *, *, *, mo, mo, mo Oberschenkel-Nomenklatur, allgemein, *, *, *, *, Oberschenkel, Pfirsich, Pfirsich Mo Assistent, Angestellter, *, *, *, *, mo, mo, mo Oberschenkel-Nomenklatur, allgemein, *, *, *, *, Oberschenkel, Pfirsich, Pfirsich Hilfswörter, Vereinigung, *, *, *, *, Von welcher Nomenklatur, Nichtunabhängigkeit, befürworten möglich, *, *, *, davon Uchi, Uchi EOS

Installieren Sie die Python-Bibliothek

Installieren Sie pip.

Der Grund für die Installation von pip ist die Installation von mecab-python mit pip.

easy_install --prefix=~/.local pip

Stellen Sie sicher, dass pip installiert ist

[home@www1635 ~/local/etc]$ pip --version pip 9.0.1 from /home/homedir/.local/lib/python2.7/site-packages/pip-9.0.1-py2.7.egg (python 2.7)

installiere mecab-python

pip install mecab-python --user Der Grund für --user ist, dass der Sakura-Server keine Root-Rechte hat. Installieren Sie ihn daher im Benutzerverzeichnis.

Führen Sie Mecab mit Python aus

Schreiben Sie diesen Quellcode.

sample.py


# coding: UTF-8

import MeCab

#Geben Sie den Speicherort des Wörterbuchs an (aus irgendeinem Grund funktioniert es nur, wenn Sie es mit dem vollständigen Pfad angeben).
userdic_path="-d /home/homedir/local/lib/mecab/dic/ipadic"
t = MeCab.Tagger("-Ochasen " + userdic_path)

text = u'Von den Oberschenkeln und Oberschenkeln'
encoded_text = text.encode('utf-8')# 
meData = t.parse(encoded_text )
print meData

Bei der Ausführung wird die folgende Anweisung ausgegeben ein Sumomo Sumomo Nomen-General Momo Momo Assistance-Teilnehmerunterstützung Oberschenkel Pfirsich Nase-General Momo Momo Assistance-Teilnehmerunterstützung Oberschenkel Pfirsich Nase-General Nonos Hilfsunion Uchi Uchi Nomenklatur-Nichtunabhängigkeit-Index möglich EOS

das ist alles! Als nächstes werde ich einen Artikel darüber schreiben, wie das Ausführungsergebnis von MeCab in einem WEB-Browser angezeigt wird.

Ergänzung

Standardisieren Sie die Bash auf dem Sakura-Mietserver http://note.sicafe.net/sakuraVPS/sakura_vimInstall.html

Recommended Posts

Installieren Sie mecab auf dem gemeinsam genutzten Sakura-Server und rufen Sie es von Python aus auf
Installieren Sie lp_solve unter Mac OSX und rufen Sie es mit Python auf.
Installieren Sie Mecab und CaboCha auf ubuntu16.04LTS, damit es aus der Python3-Serie verwendet werden kann
Installieren Sie Selenium auf Ihrem Mac und probieren Sie es mit Python aus
Installieren Sie django auf Python + Anaconda und starten Sie den Server
Installieren Sie CaboCha in der Ubuntu-Umgebung und rufen Sie es mit Python auf.
Installieren Sie Mecab und mecab-python3 unter Ubuntu 14.04
Hinweise zur Verwendung von MeCab aus Python
Rufen Sie C / C ++ von Python auf dem Mac auf
So installieren Sie OpenCV in Cloud9 und führen es in Python aus
Von Python bis zur Verwendung von MeCab (und CaboCha)
Installieren und konfigurieren Sie den TigerVNC-Server unter Linux
Installieren Sie Python3 auf dem Mixhost-Server [Derzeit NG]
Installieren Sie pyenv und Python 3.6.8 unter Ubuntu 18.04 LTS
Stellen Sie das Python-Gesichtserkennungsmodell für Heroku bereit und verwenden Sie es von Flutter ②
Stellen Sie das Python-Gesichtserkennungsmodell für Heroku bereit und verwenden Sie es von Flutter ①
Setzen Sie cron unter Ubuntu 16.04 (Sakura VPS) von 1 und führen Sie das Python-Programm regelmäßig aus
[Python] Senden Sie das von der Webkamera aufgenommene Bild an den Server und speichern Sie es
Installieren Sie Python3 und Django unter Amazon Linux (EC2) und führen Sie den Webserver aus
MeCab von Python
Installieren Sie Chrome in der Befehlszeile von Sakura VPS (Ubuntu) und starten Sie Chrome mit Python über das virtuelle Display und Selen
Installieren Sie Python3.5 + NumPy + SciPy und führen Sie es unter Windows 10 aus
Installieren Sie OpenCV 4.0 und Python 3.7 unter Windows 10 mit Anaconda
Verknüpfung von PHP und Python von Grund auf auf Laravel
Erstellen einer Python-Umgebung auf dem Sakura VPS-Server
Installieren Sie MongoDB unter Ubuntu 16.04 und arbeiten Sie über Python
Installieren Sie Python und Bibliotheken für Python unter MacOS Catalina
Installieren Sie die ZIP-Version Python und Pip unter Windows 10
Bis Python mit Pythonbrew installiert ist und Flask auf dem WSGI-Server ausgeführt wird
Installieren Sie Mecab auf Marvericks
Installieren Sie Python auf der WSL
Installieren Sie Python3 auf einem Mac und erstellen Sie eine Umgebung [Definitive Edition]
[Python3] Machen Sie einen Screenshot einer Webseite auf dem Server und schneiden Sie sie weiter zu
Installieren Sie Python auf Pidora.
Installieren Sie Scrapy auf Python3
Installieren Sie Python auf dem Mac
Installieren von Python 3 in einer Mac-Umgebung
Installieren Sie Python von der Quelle
Installieren Sie Python3.4 unter CentOS 6.6
Installieren Sie PyCall auf Raspberry PI und versuchen Sie, die GPIO-Bibliothek für Python von Ruby zu verwenden
[Windows] [Python3] Installieren Sie Python3 und Jupyter Notebook (ehemals Ipython Notebook) unter Windows
Installieren Sie Python unter Windows
Erhalten Sie E-Mails von Google Mail und beschriften Sie sie mit Python3
Kompilieren und installieren Sie MySQL-Python für Python2.7 unter Amazon Linux
Installieren Sie Python 2.7.3 unter CentOS 5.4
Installieren Sie Docker unter Arch Linux und führen Sie es remote aus
Installieren Sie Python 3.3 unter Ubuntu 12.04
Installieren Sie pyenv auf Raspberry Pi, um Python zu verwalten
Installieren Sie Python 3.4 auf einem Mac
Installieren Sie Mecab auf dem Mac
Installieren Sie Python 3.6 auf Docker
Rufen Sie die Hatena Blog API von Python aus auf und speichern Sie Ihre Blog-Artikel einzeln auf Ihrem PC
Ich habe einen Server mit Python-Socket und SSL erstellt und versucht, über den Browser darauf zuzugreifen
Setzen Sie Ubuntu in Raspi ein, setzen Sie Docker darauf und steuern Sie GPIO mit Python aus dem Container
Installieren Sie Python3 und die wissenschaftliche Berechnungsbibliothek unter Ubuntu (virtualenv + pip)
Installieren Sie pyenv auf MacBookAir und wechseln Sie Python zur Verwendung
[Python] Ich habe das Spiel von pip installiert und versucht zu spielen
Installieren Sie Python und Visual Studio Code unter Windows 10 (Version April 2020)
Gehen Sie zur Sprache, um Teil 8 zu sehen und sich daran zu erinnern. Rufen Sie die GO-Sprache von Python aus auf
Rufen Sie CPLEX von Python aus auf (DO cplex)