Ich habe auf verschiedene Artikel zur Installation von MeCab mit Python3 verwiesen. Ich habe ein kurzes Temperament, deshalb liebe ich Seiten, die gut funktionieren, wenn ich vom oberen Rand der Seite kopiere. "Mendokusai" ist eine Gewohnheit und "machen wenn nicht" ist das Motto. (In der zweiten Hälfte spielt es keine Rolle.)
CentOS7
Es war schnell, MeCab zu klonen.
# git clone https://github.com/taku910/mecab.git
# cd mecab/mecab
# ./configure --enable-utf8-only
# make
# make check
# make install
Sie können MeCab von der folgenden Seite herunterladen, aber es ist ziemlich ärgerlich. Es gab verschiedene MeCabs.
Referenz: MeCab https://drive.google.com/drive/folders/0B4y35FiV1wh7fjQ5SkJETEJEYzlqcUY4WUlpZmR4dDlJMWI5ZUlXN2xZN2s2b0pqT3hMbTQ
Wenn Sie kein Wörterbuch haben, können Sie es nicht verwenden. Installieren Sie es daher auch schnell.
# cd mecab-ipadic
# ./configure --with-charset=utf8
# make
# make install
Nachdem die Installation abgeschlossen ist, können Sie sie auf der Konsole ausführen. Probieren Sie es also aus.
# mecab
MeCab ist freie Software
MeCab Nomen,Eigenname,Organisation,*,*,*,*
Ist ein Assistent,Hilfe,*,*,*,*,Ist,C.,Beeindruckend
Freie Nomenklatur,Allgemeines,*,*,*,*,frei,frei,frei
Software-Nomenklatur,Allgemeines,*,*,*,*,Software,Software,Software
Ist ein Hilfsverb,*,*,*,Besonderer Tod,Grundform,ist,Tod,Tod
EOS
Es funktionierte. Es ist ein Moment der Erleichterung, dass Japanisch ohne Probleme angezeigt wird.
Hier kommt Pip ins Spiel.
# pip install mecab-python3
Auf anderen Websites gibt es Seiten, auf denen dieser Befehl plötzlich veröffentlicht wird. Dieser Befehl sollte jedoch auch ohne MeCab nicht funktionieren. Es versteht sich von selbst, dass ich an die Pip-Universaltheorie geglaubt habe, und als ich diesen Code sah, wurde ich von Pip Hoi Hoi erwischt, der sagte: "Das ist einfacher!"
Sie können es problemlos installieren.
Schreiben wir nun die Python-Datei test.py.
#test.py
# coding: UTF-8
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Mach es selbst, weil es nervt"))
Ich werde es versuchen.
# python test.py
Mendokusai Mendokusai Mendokusai Adjektive-Unabhängiges Adjektiv / Auoudan Grundform
Von Kara zu Auxiliary-Verbindungsassistent
Selbst Jibun Selbst Nomen-Allgemeines
De de de Assistent-Fallassistent-Allgemeines
Machen Sie Tsukuru Machen Sie Verb-Unabhängigkeit 5 Schritte, La Linie Grundform
EOS
Sie können das Datenausgabeformat ändern, indem Sie das Argument von MeCab.Tagger ändern.
-Ochasen -Owakati -Oyomi mecabrc
Es gibt noch andere solche Dinge.
#test2.py
# coding: UTF-8
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Mach es selbst, weil es nervt"))
m = MeCab.Tagger ("-Owakati")
print(m.parse ("Mach es selbst, weil es nervt"))
m = MeCab.Tagger ("-Oyomi")
print(m.parse ("Mach es selbst, weil es nervt"))
m = MeCab.Tagger ("mecabrc")
print(m.parse ("Mach es selbst, weil es nervt"))
Ich bin interessiert, also werde ich versuchen, es anzuzeigen.
# python test2.py
Mendokusai Mendokusai Mendokusai Adjektive-Unabhängiges Adjektiv / Auoudan Grundform
Von Kara zu Auxiliary-Verbindungsassistent
Selbst Jibun Selbst Nomen-Allgemeines
De de de Assistent-Fallassistent-Allgemeines
Machen Sie Tsukuru Machen Sie Verb-Unabhängigkeit 5 Schritte, La Linie Grundform
EOS
Machen Sie es sich aus Ärger
Mendoku Saikara Jibun Detsukuru
Ärgerliche Adjektive,Unabhängigkeit,*,*,Apokalypse,Grundform,Problematisch,Nervig,Nervig
Vom Assistenten,Verbindungsassistent,*,*,*,*,Von,Kara,Kara
Meine Nomenklatur,Allgemeines,*,*,*,*,mich selber,Jibun,Jibun
Hilfs,Fallassistent,Allgemeines,*,*,*,damit,De,De
Verb machen,Unabhängigkeit,*,*,Fünf Schritte, La Linie,Grundform,erstellen,Tsukuru,Tsukuru
EOS
Was tun, wenn Ihnen mitgeteilt wird, dass Sie libmecab.so.2 nicht haben?
ImportError: libmecab.so.2: cannot open shared object file: No such file or directory
Ansatz
$ vi /etc/ld.so.conf.d/lib.conf
/usr/local/lib #<--Neu ausfüllen oder hinzufügen.
$ ldconfig #<--Neu laden
Referenz: Extraktion wichtiger Wörter aus Wikipedia durch TF / IDF mit Mecab Python http://yut.hatenablog.com/entry/20130215/1360884220
Referenz: Aktivieren Sie die morphologische Analyse-Engine MeCab in Python3 (Version März 2016). http://qiita.com/grachro/items/4fbc9bf8174c5abb7bdd#_reference-f17313e8bc66cbbff3ef
Recommended Posts