[PYTHON] Richten Sie eine Entwicklungsumgebung für die Verarbeitung natürlicher Sprache ein

Installieren Sie die folgenden Pakete. Das Betriebssystem ist Ubuntu 16.04.

--python (3.5.0) - Sprache mit vielen Bibliotheken für die Verarbeitung natürlicher Sprache --pyenv - Ein Paket, das die Version von Python verwaltet --MeCab (0.996) --Morphologische Analyse-Engine --CaboCha (0.69) - Abhängigkeitsanalyse-Engine --gensim (0.12.4) - Eine Bibliothek, die beliebte LDA und word2vec verwenden kann

python3,pyenv

Fügen Sie vorerst Python ein. $ sudo apt-get install python Ich denke, dass Python2.7 nur mit diesem installiert wird, also werde ich Pyenv fallen lassen, das die Version von Python verwaltet. $ git clone https://github.com/yyuu/pyenv.git ~/.pyenv Fügen Sie zur Verwendung von pyenv das folgende Skript zu einer Shell-Konfigurationsdatei wie .zshenv hinzu.

export PYENV_ROOT="$HOME/.pyenv"
export PATH=$PATH:$PYENV_ROOT/bin
eval "$(pyenv init -)"

** Nachtrag (11.12.2017) ** Ich habe die Exportreihenfolge umgekehrt. Dies kann nur korrekt durchgeführt werden, wenn PYENV_ROOT zuerst definiert und beim Definieren von PATH aufgerufen wird.

Ich verwende zsh, aber wenn ich Python aus einem als Datei gespeicherten Shell-Skript aufrufe, wird es zu Python2.7. Ich habe alle diese Einstellungen in .zshrc geschrieben, aber wenn Sie genau hinschauen, ist .zshrc eine Einstellung, die nur für den Stream gilt (wenn eine Person einen Befehl eingibt), nicht für ein Shell-Skript. Es scheint, dass. .zshenv ist eine Konfigurationsdatei, die immer ausgeführt wird, wenn zsh gestartet wird. Schreiben Sie alle Umgebungsvariablen in .zshenv.

Verwenden wir pyenv. Überprüfen Sie die Liste der Python-Versionen, die installiert werden können. $ pyenv install -l

Nachdem Sie bestätigt haben, dass 3.5.0 vorhanden ist, installieren Sie Python 3.5.0, ändern Sie die Verwendungsversion und aktualisieren Sie. Wenn die endgültige Versionsprüfung 3.5.0 anzeigt, ist sie erfolgreich.

$ pyenv install 3.5.0
$ pyenv global 3.5.0
$ pyenv rehash
$ python --version

Installieren Sie dann das Bibliotheksverwaltungstool von Python, pip. Es wird in den nachfolgenden Einstellungen mehrmals verwendet.

$ sudo apt-get install python-pip

Referenz-URL Superschnelle Setup-Anleitung für Zsh-Anfänger http://qiita.com/uasi/items/c4288dd835a65eb9d709 Mindestnotizen bei Verwendung von Python auf Mac (pyenv edition) http://qiita.com/zaburo/items/dd1a8323633035614efc pyenv + virtualenv (CentOS7) http://qiita.com/saitou1978/items/e82421e29e118bd397cc Wenn Sie easy_install oder pip mit Python unter Ubuntu verwenden möchten http://tech.g.hatena.ne.jp/rx7/20101129/p1

MeCab

Installieren Sie MeCab und andere erforderliche Pakete. $ sudo apt-get install mecab mecab-ipadic libmecab-dev

Wenn Sie mecab-ipadic einfügen, lautet der Zeichencode utf-8. Wenn libmecab-dev nicht enthalten ist, wird es Ärger verursachen, wenn mecab-config nicht enthalten ist. Die Wörterbücher, die mit MeCab verwendet werden können, umfassen ipadic und juman, aber dieses Mal werden wir mecab-ipadic-neologd verwenden. Das Merkmal dieses Wörterbuchs ist, dass es viele richtige Nomenklaturen, Symbole und Gesichtsbuchstaben enthält. Lassen Sie es uns mit dem folgenden Befehl installieren.

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git <Pfad zum Speichern des Speicherorts>
$ cd <Speicherort gespeichert>/mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -h

Ich denke, der Speicherort sollte der gleiche sein wie das vorhandene Wörterbuch. Sie können den Speicherort des Wörterbuchs finden, das Sie derzeit mit mecab -D verwenden. Verwenden Sie dazu den folgenden Befehl.

mecab -d <Speicherort speichern> / mecab-ipadic-neologd /

Als nächstes binden Sie, damit MeCab von Python aus verwendet werden kann. Verwenden Sie den folgenden Befehl.

$ pip install mecab-python3

Wenn der folgende Befehl keinen Fehler enthält, ist er erfolgreich.

$ python
>>> import MeCab

Referenz-URL mecab-ipadic-NEologd : Neologism dictionary for MeCab https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

CaboCha

Ich habe versucht, es wie zuvor mit dem folgenden Befehl zu installieren.

$ sudo apt-get install subversion
$ pip install 'svn+http://cabocha.googlecode.com/svn/trunk/python@r99'

Ich war wütend, dass ich das Paket nicht finden konnte. Ich habe verschiedene andere Methoden ausprobiert, aber am Ende habe ich beschlossen, sie mit der auf der offiziellen Website beschriebenen Methode zu löschen. Zuallererst die Bibliothek CRF ++, die für Cabocha benötigt wird, aber ich denke, es hat mit wget nicht funktioniert, also habe ich sie über den unten stehenden Link heruntergeladen.

CRF++ https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list

Ich ließ Cabocha selbst mit Wget fallen. Die Version ist am Verbindungsziel 0,67, aber setzen wir sie auf die neueste Version 0,69.

$ tar zvxf  CRF++-0.58.tar.gz
$ cd CRF++-0.58
$ ./configure
$ make 
$ sudo make install
$ sudo ldconfig
$ wget http://cabocha.googlecode.com/files/cabocha-0.69.tar.bz2
$ tar xjvf cabocha-0.69.tar.bz
$ cd cabocha-0.69
$ ./configure --with-charset=UTF8 --with-posset=IPA
$ make
$ sudo make install
$ sudo ldconfig
$ cabocha

Als nächstes binden Sie an Python3. Ändern Sie setup.py ein wenig, da python3 im ursprünglichen Zustand nicht unterstützt wird. setup.py befindet sich unter cabocha-69 / python.

setup.py


#Unterlassung
def cmd2(str):
#   return string.split (cmd1(str))Löschen Sie diese Zeile
    return cmd1(str).split() #Fügen Sie diese Zeile ein
#Unterlassung

Installieren Sie es nach dem Reparieren mit dem folgenden Befehl.

$ cd cabocha-0.69/python
$ sudo python setup.py build_ext
$ sudo python setup.py install
$ sudo ldconfig

Geben Sie bei Verwendung von Cabocha das Wörterbuch wie im folgenden Befehl angegeben an.

cabocha -d <Speicherort speichern> / mecab-ipadic-neologd /

Wenn der folgende Befehl keinen Fehler enthält, ist er erfolgreich.

$ python
>>> import CaboCha

Referenz-URL Offizielle CaboCha-Website https://taku910.github.io/cabocha/ Installationshinweise für Cabocha http://qiita.com/ShingoOikawa/items/ef4ac2929ec19599a3cf Ich habe einen Patch geschrieben, um CaboCha mit Python3 zu verwenden http://nosada.hatenablog.com/entry/2014/03/14/002954 Geben Sie das Wörterbuch mit CaboCha (Python) an. http://studylog.hateblo.jp/entry/2016/01/25/134507

gensim

Sie können es einfach mit dem folgenden Befehl installieren. numpy und scipy sind Bibliotheken, die für die Verwendung von gensim erforderlich sind.

$ pip install numpy
$ pip install scipy
$ pip install gensim

Überprüfen Sie wie im Beispiel, ob es mit dem folgenden Befehl installiert werden kann.

$ python
>>> import numpy
>>> import scipy
>>> import gensim

Referenz-URL gensim:installation https://radimrehurek.com/gensim/install.html

Damit sind die Umgebungseinstellungen abgeschlossen. Danke für deine harte Arbeit.

Am Ende

Die meisten von ihnen bezogen sich auf die Artikel, die ich zuvor in meinem eigenen Blog geschrieben habe.

Upgrade von Python2.7 auf 3.5 (NLP-Version) http://woody-kawagoe.hatenablog.com/entry/2016/04/18/222535

Ich war wieder süchtig danach und wollte verschiedene Dinge über Qiita schreiben, also habe ich es umgeschrieben und auf Qiita gepostet.

Recommended Posts

Richten Sie eine Entwicklungsumgebung für die Verarbeitung natürlicher Sprache ein
Richten Sie eine Python-Entwicklungsumgebung auf Marvericks ein
Richten Sie die TinyGo-Entwicklungsumgebung für VS Code ein
Erstellen einer Umgebung für die Verarbeitung natürlicher Sprache mit Python
Richten Sie mit Sublime Text 2 eine Python-Entwicklungsumgebung ein
Verarbeitung natürlicher Sprache für vielbeschäftigte Menschen
Richten Sie eine Python-Entwicklungsumgebung mit Visual Studio Code ein
Erstellen einer Python-Entwicklungsumgebung für die KI-Entwicklung
Erstellen einer Entwicklungsumgebung für maschinelles Lernen
Versuchen Sie ernsthaft, eine Vim-Testumgebung einzurichten (für Python).
Erstellen Sie eine Entwicklungsumgebung für die C-Sprache mit einem Container
Bereiten Sie eine Programmiersprachenumgebung für die Datenanalyse vor
Ich habe versucht, eine Docker-Datei für die Entwicklungsumgebung von Django zu erstellen
Richten Sie einen UDP-Server in der Sprache C ein
Erstellen Sie eine Kubernetes-Umgebung für die Entwicklung unter Ubuntu
So richten Sie einen lokalen Entwicklungsserver ein
Richten Sie eine Objective-C 2.0-Entwicklungsumgebung unter Linux ein
Erstellen Sie eine mruby-Entwicklungsumgebung für ESP32 (Linux Edition)
Python: Verarbeitung natürlicher Sprache
RNN_LSTM2 Verarbeitung natürlicher Sprache
So richten Sie eine Python-Umgebung mit pyenv ein
Erstellen Sie eine lokale Entwicklungsumgebung für Laravel6.X auf Ihrem Mac
So erstellen Sie eine Entwicklungsumgebung für TensorFlow (1.0.0) (Mac)
Für ArcPy geeignete Entwicklungsumgebung
Für Mac einrichten (Python)
Verarbeitung natürlicher Sprache 1 Morphologische Analyse
Verarbeitung natürlicher Sprache 3 Wortkontinuität
[Zum Organisieren] Python-Entwicklungsumgebung
Verarbeitung natürlicher Sprache 2 Wortähnlichkeit
[Memo] Erstellen Sie mit Docker eine Entwicklungsumgebung für Django + Nuxt.js
Erstellen einer Entwicklungsumgebung für Android-Apps - Erstellen von Android-Apps mit Python
Lassen Sie uns ein Überlebensvorhersagemodell für Titanic-Passagiere einrichten
So richten Sie WSL2 unter Windows 10 ein und erstellen eine Lernumgebung für Linux-Befehle
Ich möchte eine GUI-Entwicklungsumgebung mit Python oder Golang auf dem Mac einrichten
Studieren Sie die Verarbeitung natürlicher Sprache mit Kikagaku
100 Klicks in der Verarbeitung natürlicher Sprache Kapitel 4 Kommentar
Erstellen Sie mit dem Serverless Framework eine lokale Entwicklungsumgebung für Lambda + Python
[Verarbeitung natürlicher Sprache] Vorverarbeitung mit Japanisch
[Für Anfänger] Django -Entwicklungsumgebung Bau-
Erstellen Sie mit BERT + LightGBM + optuna ganz einfach ein Modell für die Verarbeitung natürlicher Sprache
Künstliche Sprache Logivan und Verarbeitung natürlicher Sprache (Verarbeitung künstlicher Sprache)
[Einführung in RasPi4] Umgebungskonstruktion, Mecab des Verarbeitungssystems für natürliche Sprache usw. .. .. ♪
Optionen für die Python-Entwicklungsumgebung für Mai 2020
Richten Sie die Python-Umgebung unter CentOS ein
Emacs-Einstellungen für die Python-Entwicklungsumgebung
Dockerfile mit den notwendigen Bibliotheken für die Verarbeitung natürlicher Sprache mit Python
Lose Artikel für diejenigen, die mit der Verarbeitung natürlicher Sprache beginnen möchten
Warum ist der verteilte Ausdruck von Wörtern für die Verarbeitung natürlicher Sprache wichtig?
100 Sprachverarbeitung klopfen 2020 "für Google Colaboratory"
Ich habe eine Entwicklungsumgebung für Django 3.0 mit Docker, Docker-Compose und Poetry erstellt
Vorbereitung zum Starten der Verarbeitung natürlicher Sprache
Installationszusammenfassung des Analysators für die Verarbeitung natürlicher Sprache
So richten Sie die Entwicklungsumgebung von ev3dev ein [Windows-Version]
[DynamoDB] [Docker] Erstellen Sie mit Docker-Compose eine Entwicklungsumgebung für DynamoDB und Django
[Entwicklungsumgebung] So erstellen Sie einen Datensatz in der Nähe der Produktionsdatenbank
3. Verarbeitung natürlicher Sprache mit Python 1-2. So erstellen Sie einen Korpus: Aozora Bunko
Python-Entwicklungsumgebung für macOS mit venv 2016
Erstellen Sie mit Laragon ganz einfach eine Entwicklungsumgebung