Installieren Sie Mecab und mecab-python3 unter Ubuntu 14.04

Überblick

Mecab ist eine Open-Source-Engine für morphologische Analysen. Es kann verwendet werden, um japanische Sätze als Vorbereitung für maschinelles Lernen zu teilen. Ziel dieses Artikels ist es, Mecab zu installieren und in Python verfügbar zu machen.

Umgebung

Installationsverfahren

  1. Mecab

Ich habe auf [diesen Artikel] verwiesen (https://gist.github.com/YoshihitoAso/9048005).

$ sudo apt-get install mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8

(Ich bin nicht sicher, ob ich sowohl mecab-ipadic als auch mecab-ipadic-utf8 brauche, aber es scheint vorerst zu funktionieren)

Sie können das Ergebnis der morphologischen Analyse sehen, indem Sie den Befehl mecab ausführen und japanische Sätze eingeben. Zum Beispiel ist das Ergebnis der Einreise von "Premierminister Shinzo Abe" wie folgt.

$ mecab
Premierminister Shinzo Abe
Abe Substantiv,Proprietäre Nomenklatur,Name der Person,Nachname,*,*,Abe,Abe,Abe
Jin Nomen,Proprietäre Nomenklatur,Name der Person,Name,*,*,Jin,Susumu,Susumu
Drei Nomenklatur,Nummer,*,*,*,*,drei,Sonne,Sonne
Nomenklatur des Premierministers,Allgemeines,*,*,*,*,Premierminister,Shusho,Shusho
EOS

"Shinzo" wurde nicht richtig analysiert.

  1. mecab-ipadic-NEologd

Das Standard-IPA-Wörterbuch scheint anfällig für die Analyse der richtigen Nomenklatur zu sein. Daher haben wir die korrekte Nomenklatur und andere neue Wörter mecab-ipadic-NEologd erheblich verbessert. Geben Sie ein Wörterbuch mit dem Namen blob / master / README.ja.md ein.

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n -a

Bearbeiten Sie / etc / mecabrc, um dies als Standardwörterbuch anzugeben

dicdir = /usr/lib/mecab/dic/mecab-ipadic-neologd

Wird besorgt.

Weitere Informationen finden Sie in der offiziellen Dokumentation (https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md).

In ähnlicher Weise analysieren wir "Premierminister Shinzo Abe".

$ mecab -d                              
Premierminister Shinzo Abe
Premierminister Shinzo Abe Nominal,Proprietäre Nomenklatur,Allgemeines,*,*,*,Shinzo Abe,Abe Shinzo Shusho,Abe Shinzosh Show
EOS

Dieses Mal wird es korrekt als richtige Nomenklatur erkannt.

mecab-python3

Fügen Sie die Mecab-Bindung für Python 3 hinzu.

$ pip install mecab-python3

Das ist in Ordnung.

mecab-test3


import sys
import MeCab
m = MeCab.Tagger("-Ochasen")
print(m.parse("Premierminister Shinzo Abe hielt auf dem Landtag eine Grundsatzrede."))

Wenn du rennst

$ python mecab-test.py 
Premierminister Shinzo Abe Shinzo Abe Shinzo Abe Shinzo Nominal-Proprietäre Nomenklatur-Allgemeines
Ha ha ist ein Assistent-Hilfe
,,, Symbol-Lesepunkt
Parlament Kokkai Parlamentsnomenklatur-Allgemeines
De de de Assistent-Fallassistent-Allgemeines
Grundsatzrede Shisei Houshin Enzetsu Grundsatzrede Nominal-Proprietäre Nomenklatur-Allgemeines
Wo wo Auxiliary-Fallassistent-Allgemeines
Go Okonatsu Do verb-Unabhängige fünfstufige / wa-Leitung, die eine kontinuierliche Verbindung zum Sounddienst anfordert
Ta ta ta Hilfsverb spezielle ta ta Grundform
.. .. .. Symbol-Phrase
EOS

Es wird sein.

Wenn Sie separat schreiben möchten

m = MeCab.Tagger("-Owakati")

Du kannst es schaffen.

mecab-wakati-test.py


import sys
import MeCab
m = MeCab.Tagger("-Owakati")
items = m.parse("Premierminister Shinzo Abe hielt auf dem Landtag eine Grundsatzrede.")
print(items)
print(type(items))

Wenn du rennst

$ python mecab-wakati-test.py          
Premierminister Shinzo Abe hielt auf dem Landtag eine Grundsatzrede.

<class 'str'>

Das Ergebnis wird als Zeichenfolge zurückgegeben. Wenn Sie also eine Liste erstellen möchten, können Sie "split ()" ausführen.

Recommended Posts

Installieren Sie Mecab und mecab-python3 unter Ubuntu 14.04
Installieren Sie Dropbox und führen Sie es unter Ubuntu 20.04 aus
Installieren Sie OpenCV und Chainer unter Ubuntu
Installieren Sie CUDA 8.0 und Chainer unter Ubuntu 16.04
Installieren Sie Fabric unter Ubuntu und versuchen Sie es
Installieren Sie Puppet Master und Client unter Ubuntu 16.04
Installieren Sie pyenv und Python 3.6.8 unter Ubuntu 18.04 LTS
Installieren Sie Mecab auf Marvericks
Installieren Sie TensorFlow unter Ubuntu
Installieren Sie PySide2 unter Ubuntu
Installieren Sie JModelica unter Ubuntu
Installieren Sie mecab-python unter CentOS
Installieren Sie Python 3.3 unter Ubuntu 12.04
Installieren Sie Theano unter Ubuntu 12.04
Installieren Sie Mecab auf dem Mac
Installiere angr unter Ubuntu 18.04
Installieren Sie Mecab-Python auf dem Mac
Installiere pip / pip3 unter Ubuntu
Installieren Sie MongoDB unter Ubuntu 16.04 und arbeiten Sie über Python
Installieren Sie OpenCV unter Ubuntu + Python
wsl Installiere PostgreSQL unter Ubuntu 18.04
[ROS] Installiere ROS (melodisch) unter Ubuntu (18.04)
Installieren Sie Caffe unter Ubuntu 14.04 (GPU)
Installieren Sie Docker unter WSL Ubuntu 18.04
Installieren Sie Apache 2.4 unter Ubuntu 19.10 Eoan Ermine und führen Sie CGI aus
Installieren Sie CUDA10.1 + cuDNN7.6.5 + tensorflow-2.3.0 unter Ubuntu 18.04
Installieren Sie Python 3.8 unter Ubuntu 18.04 (Betriebssystemstandard)
Installieren Sie Caffe unter Ubuntu 14.04 (CPU-Modus)
Installieren Sie Python 3.8 unter Ubuntu 20.04 (Betriebssystemstandard)
Erstellen und installieren Sie OpenCV unter Windows
Installieren Sie Python3 und die wissenschaftliche Berechnungsbibliothek unter Ubuntu (virtualenv + pip)
Installieren Sie Python 3.9 unter Ubuntu 20.04 (Betriebssystemstandard?)
Installieren Sie Confluent-Kafka für Python unter Ubuntu
Installieren Sie Python 2.7 unter Ubuntu 20.04 (Betriebssystemstandard?)
ROS-Studie Nr. 1 Installation von ros-noetic unter Ubuntu 20.04
Installieren Sie easy_install und pip unter Windows
Installieren Sie mecab auf dem gemeinsam genutzten Sakura-Server und rufen Sie es von Python aus auf
Installieren Sie Ubuntu 18.04 auf dem MacBook Pro Touchbar-Modell und stellen Sie eine Verbindung zu WIFI her
Erstellen Sie Python 3 und OpenCV unter Ubuntu 18.04
Installieren Sie wsl2 und Master Linux unter Windows
Virtuelle Python-Umgebung und Pakete unter Ubuntu
Schritte zum Installieren der Python-Umgebung unter Ubuntu
Installieren und starten Sie k3s unter Manjaro Linux
Installieren und konfigurieren Sie den TigerVNC-Server unter Linux
Installieren Sie Pleasant unter Ubuntu 20.04 (.NetCore3.1 / PostgreSQL-Version)
Installieren Sie Ubuntu auf einem 32-Bit-UEFI-Ultra-Notebook
Installieren Sie Caffe mit 3D-CNN auf einem sauberen Ubuntu 14.04
Wie installiere ich php7.4 unter Linux (Ubuntu)
Installieren Sie pyenv und rbenv systemweit unter CentOS
Shebang auf Ubuntu 20.04
Verwalten Sie Django-Bilder und statische Assets unter Ubuntu
Installieren Sie matplotlib und zeigen Sie das Diagramm in Jupyter Notebook an
Dask kann unter Ub nicht mit pip auf Ubuntu installiert werden
Installieren Sie Python3.5 + NumPy + SciPy und führen Sie es unter Windows 10 aus
Installieren Sie das Python-Paket in einer persönlichen Umgebung unter Ubuntu
[Prozedur-Memo] Installieren Sie Python3 + OpenSSL lokal unter Ubuntu
[Hinweis] Installieren Sie wxPython 3.x unter Linux Mint (Ubuntu)