Da die morphologische Analyse zur Vorverarbeitung von Daten verwendet werden kann, die für NLP verwendet werden, wird sie zusammengefasst.
Eine japanische Open-Source-Engine für morphologische Analysen.
Entwickelt von Taku Kudo, einem aktuellen Google-Softwareentwickler und einem der japanischen Eingabeentwickler von Google. Der Name wurde vom Lieblingsentwickler "Wafubu" übernommen.
Installieren Sie MeCab selbst.
$ brew install mecab
Installieren Sie das MeCab-Wörterbuch.
$ brew install mecab-ipadic
Überprüfen Sie, ob MeCab installiert ist.
$ mecab --version
mecab of 0.996
Versuchen wir es mit einer morphologischen Analyse.
$ mecab
Versuchen wir es mit einer morphologischen Analyse.
Probe Nomen,Allgemeines,*,*,*,*,Versuch,Tamesh,Tamesh
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,D.,D.
Morphologische Nomenklatur,Allgemeines,*,*,*,*,Morphem,Keitaiso,Keitaiso
Analytisches Substantiv,Verbindung ändern,*,*,*,*,Analyse,Kaiseki,Kaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS
Das Wort ** morphologische Analyse ** wurde in ** morphologische Elemente ** und ** Analyse ** zerlegt. Um dies zu lösen, installieren Sie das neueste Wörterbuch ** mecab-ipadic-NEologd **. Klonen Sie zunächst die Wörterbuchdaten von GitHub.
$ git clone --depth 1 [email protected]:neologd/mecab-ipadic-neologd.git
Gehen Sie zum geklonten Repository, führen Sie install aus und wählen Sie im Bestätigungsbildschirm yes aus.
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
yes
Geben Sie das Wörterbuch mit der Option -d an und versuchen Sie es erneut mit der morphologischen Analyse.
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
Versuchen wir es mit einer morphologischen Analyse.
Testzusatz,Allgemeines,*,*,*,*,Als Test,Tameshini,Tameshini
Nomenklatur der morphologischen Analyse,Proprietäre Nomenklatur,Allgemeines,*,*,*,Morphologische Analyse,Keitaisokaiseki,Keitaisokaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS
Sicher wurde es ein Wort ** morphologische Analyse **.
Installieren Sie die Bibliothek für Python.
pip3 install mecab-python3
Danach schreiben Sie den Code und versuchen Sie es.
import MeCab
mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')
print(mecab.parse('Versuchen wir es mit einer morphologischen Analyse.'))
Testzusatz,Allgemeines,*,*,*,*,Als Test,Tameshini,Tameshini
Nomenklatur der morphologischen Analyse,Proprietäre Nomenklatur,Allgemeines,*,*,*,Morphologische Analyse,Keitaisokaiseki,Keitaisokaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS
Recommended Posts