Fordern Sie Text Mining mit Python heraus. (Für Python3-Serie) Folgen Sie den unteren Schritten.
① Morphologische Analyse (dieser Artikel) ② Visualisieren Sie mit Word Cloud (nächstes Mal)
Letztes Mal habe ich versucht, MeCab unter Windows zu verwenden, bin auf die Installation von Python-Bindungen gestoßen und habe aufgegeben, also bin ich zu Linux gewechselt und neu gestartet.
(Rezension) So stellen Sie MeCab in Python zur Verfügung ・ Installation des MeCab-Hauptgeräts ・ Installation des Wörterbuchs · Installation der Python-Bindung Ist notwendig.
Die Windows-Version wurde mit einem an MeCab selbst angehängten Wörterbuch geliefert, die Linux-Version muss jedoch separat installiert werden. Sie können es jedoch zusammen mit dem Paket installieren.
Einfach mit apt installieren. Wählen Sie für das Wörterbuch die UTF-8-Version von IPA aus (empfohlen).
sudo apt-get install mecab mecab-ipadic-utf8
Überprüfen Sie den Vorgang wie gewohnt mit "Momo no Uchi".
$ mecab
Von den Oberschenkeln und Oberschenkeln
Sumomo Substantiv,Allgemeines,*,*,*,*,Sumomo,Sumomo,Sumomo
Auch Assistent,Hilfe,*,*,*,*,Ebenfalls,Mo.,Mo.
Oberschenkel Nomen,Allgemeines,*,*,*,*,Pfirsiche,Pfirsich,Pfirsich
Auch Assistent,Hilfe,*,*,*,*,Ebenfalls,Mo.,Mo.
Oberschenkel Nomen,Allgemeines,*,*,*,*,Pfirsiche,Pfirsich,Pfirsich
Hilfswörter,Union,*,*,*,*,von,Nein,Nein
Davon Nomenklatur,Nicht unabhängig,Anwalt möglich,*,*,*,Zuhause,Uchi,Uchi
EOS
Installieren Sie dies einfach mit apt.
sudo apt-get install python-mecab
Lassen Sie uns "Sumomo ..." aus Python analysieren.
mecab_sample.py
# coding: utf-8
import sys
import MeCab
mecab = MeCab.Tagger("-Ochasen")
print(mecab.parse("Von den Oberschenkeln und Oberschenkeln"))
$ python3 mecab_sample.py
Traceback (most recent call last):
File "mecab_sample.py", line 3, in <module>
import MeCab
ImportError: No module named 'MeCab'
Es wird gesagt, dass es kein MeCab gibt ... Versuchen Sie es mit Python 2.x.
$ python mecab_sample.py
Sumomo Sumomo Nomen-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Nonos Assistent-Union
Uchi Uchi Nomen-Nicht unabhängig-Anwalt möglich
EOS
Dieser funktioniert gut. Wenn ich gegoogelt habe, scheint es, dass das, was ich mit apt eingegeben habe, nur mit der Python 2.x-Serie funktioniert. Um es in der Python3-Serie zu verwenden, scheint es notwendig zu sein, die Quelle zu bringen und mit setup.py zu erstellen, wie ich es in der Windows-Version getan habe, aber es wird auch in der Python2-Serie vorausgesetzt und ein Patch ist erforderlich, um es in der Python3-Serie auszuführen. Es scheint, dass Sie es treffen müssen, also scheint es, dass es nicht einfach ist.
Äh, es ist ein Ärger ... Ich habe einen Artikel gefunden, der besagt, dass es in Ordnung ist, eine Bibliothek für Python3 mit pip zu erstellen, also werde ich es versuchen.
$ pip3 install mecab-python3
Collecting mecab-python3
Using cached mecab-python3-0.7.tar.gz
Complete output from command python setup.py egg_info:
/bin/sh: 1: mecab-config: not found
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 41, in <module>
include_dirs=cmd2("mecab-config --inc-dir"),
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 21, in cmd2
return cmd1(strings).split()
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 18, in cmd1
return os.popen(strings).readlines()[0][:-1]
IndexError: list index out of range
----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-gsw8fi5f/mecab-python3/
Ich erhalte eine Fehlermeldung, weil es keine Mecab-Konfiguration wie in Windows gibt. Ich habe libmecab-dev nicht angegeben, weil ich es bei der ersten Installation von MeCab nicht benötigt habe. Es scheint also, dass es nicht enthalten ist. Geben Sie mit apt.
sudo apt-get install libmecab-dev
Verwenden Sie dann pip, um die Bindung für die Python3-Serie einzufügen.
sudo pip3 install mecab-python3
Führen Sie dann das Beispiel in Python3 aus.
$ python3 mecab_sample.py
Sumomo Sumomo Nomen-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Sowohl mo als auch mo-Hilfe
Oberschenkel Pfirsich Nomenklatur-Allgemeines
Nonos Assistent-Union
Uchi Uchi Nomen-Nicht unabhängig-Anwalt möglich
EOS
Ich konnte es endlich schaffen.
Recommended Posts