[Python] Morphologische Analyse mit MeCab

Da die morphologische Analyse zur Vorverarbeitung von Daten verwendet werden kann, die für NLP verwendet werden, wird sie zusammengefasst.

Was ist MeCab?

Eine japanische Open-Source-Engine für morphologische Analysen.

Entwickelt von Taku Kudo, einem aktuellen Google-Softwareentwickler und einem der japanischen Eingabeentwickler von Google. Der Name wurde vom Lieblingsentwickler "Wafubu" übernommen.

Zitiert aus Wikipedia

Umgebung

Installation

Installieren Sie MeCab selbst.

$ brew install mecab

Installieren Sie das MeCab-Wörterbuch.

$ brew install mecab-ipadic

Überprüfen Sie, ob MeCab installiert ist.

$ mecab --version
mecab of 0.996

Versuchen wir es mit einer morphologischen Analyse.

$ mecab
Versuchen wir es mit einer morphologischen Analyse.
Probe Nomen,Allgemeines,*,*,*,*,Versuch,Tamesh,Tamesh
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,D.,D.
Morphologische Nomenklatur,Allgemeines,*,*,*,*,Morphem,Keitaiso,Keitaiso
Analytisches Substantiv,Verbindung ändern,*,*,*,*,Analyse,Kaiseki,Kaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS

Das Wort ** morphologische Analyse ** wurde in ** morphologische Elemente ** und ** Analyse ** zerlegt. Um dies zu lösen, installieren Sie das neueste Wörterbuch ** mecab-ipadic-NEologd **. Klonen Sie zunächst die Wörterbuchdaten von GitHub.

$ git clone --depth 1 [email protected]:neologd/mecab-ipadic-neologd.git

Gehen Sie zum geklonten Repository, führen Sie install aus und wählen Sie im Bestätigungsbildschirm yes aus.

$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
yes

Geben Sie das Wörterbuch mit der Option -d an und versuchen Sie es erneut mit der morphologischen Analyse.

$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
Versuchen wir es mit einer morphologischen Analyse.
Testzusatz,Allgemeines,*,*,*,*,Als Test,Tameshini,Tameshini
Nomenklatur der morphologischen Analyse,Proprietäre Nomenklatur,Allgemeines,*,*,*,Morphologische Analyse,Keitaisokaiseki,Keitaisokaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS

Sicher wurde es ein Wort ** morphologische Analyse **.

Wird in Python verwendet

Installieren Sie die Bibliothek für Python.

pip3 install mecab-python3

Danach schreiben Sie den Code und versuchen Sie es.

import MeCab

mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')
print(mecab.parse('Versuchen wir es mit einer morphologischen Analyse.'))


Testzusatz,Allgemeines,*,*,*,*,Als Test,Tameshini,Tameshini
Nomenklatur der morphologischen Analyse,Proprietäre Nomenklatur,Allgemeines,*,*,*,Morphologische Analyse,Keitaisokaiseki,Keitaisokaiseki
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Shi Verb,Unabhängigkeit,*,*,Sahen / Suru,Kontinuierlicher Typ,Machen,Shi,Shi
Der Assistent,Verbindungsassistent,*,*,*,*,Hand,Te,Te
Miru Verb,Nicht unabhängig,*,*,Ein Schritt,Grundform,Aussicht,Mühle,Mühle
.. Symbol,Phrase,*,*,*,*,。,。,。
EOS

Recommended Posts

[Python] Morphologische Analyse mit MeCab
Japanische morphologische Analyse mit Python
Text Mining mit Python ① Morphologische Analyse
Ich habe mit Mecab gespielt (morphologische Analyse)!
Sammeln von Informationen von Twitter mit Python (morphologische Analyse mit MeCab)
Datenanalyse mit Python 2
Verwenden Sie Mecab mit Python 3
Sprachanalyse mit Python
Tweet-Analyse mit Python, Mecab und CaboCha
Sprachanalyse mit Python
Python: Vereinfachte morphologische Analyse mit regulären Ausdrücken
Datenanalyse mit Python
[Analyse des gemeinsamen Auftretens] Einfache Analyse des gemeinsamen Auftretens mit Python! [Python]
Python: Japanischer Text: Morphologische Analyse
Emotionsanalyse von Python (word2vec)
Planare Skelettanalyse mit Python
Muskel-Ruck-Analyse mit Python
[PowerShell] Morphologische Analyse mit SudachiPy
Text Mining mit Python ① Morphologische Analyse (re: Linux-Version)
Dreidimensionale Skelettstrukturanalyse mit Python
Impedanzanalyse (EIS) mit Python [impedance.py]
■ [Google Colaboratory] Verwenden Sie die morphologische Analyse (MeCab)
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Logistische Regressionsanalyse Selbst erstellt mit Python
Bei Verwendung von MeCab mit virtualenv python
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Morphologische Analyse mit Igo + mecab-ipadic-neologd in Python (mit Ruby-Bonus)
FizzBuzz in Python3
Scraping mit Python
Statistik mit Python
[In-Database Python Analysis Tutorial mit SQL Server 2017]
Zweidimensionale Analyse des gesättigten und ungesättigten Permeationsflusses mit Python
Scraping mit Python
Python mit Go
Datenanalyse Python
Verwenden von Python und MeCab mit Azure Databricks
Maschinelles Lernen mit Python (2) Einfache Regressionsanalyse
Aktivieren Sie die morphologische Analyse-Engine MeCab in Python 3 (Version März 2016).
2D FEM Stressanalyseprogramm von Python
Twilio mit Python
In Python integrieren
Spielen Sie mit 2016-Python
AES256 mit Python
Getestet mit Python
Python beginnt mit ()
mit Syntax (Python)
MeCab von Python
Bingo mit Python
Zundokokiyoshi mit Python
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Von der Einführung von JUMAN ++ bis zur morphologischen Analyse von Japanisch mit Python
Zweidimensionale instationäre Wärmeleitungsanalyse mit Python
Verwenden Sie Python und MeCab mit Azure-Funktionen
Excel mit Python
Mikrocomputer mit Python
Mit Python besetzen
Von der Vorbereitung der morphologischen Analyse mit Python unter Verwendung von Polyglot bis zur Teilwortmarkierung
[Lass uns mit Python spielen] Ziel ist die automatische Satzgenerierung ~ Morphologische Analyse durchführen ~
[Verschiedene Bildanalysen mit Plotly] Dynamische Visualisierung mit Plotly [Python, Bild]