Installieren Sie die folgenden Pakete. Das Betriebssystem ist Ubuntu 16.04.
--python (3.5.0) - Sprache mit vielen Bibliotheken für die Verarbeitung natürlicher Sprache --pyenv - Ein Paket, das die Version von Python verwaltet --MeCab (0.996) --Morphologische Analyse-Engine --CaboCha (0.69) - Abhängigkeitsanalyse-Engine --gensim (0.12.4) - Eine Bibliothek, die beliebte LDA und word2vec verwenden kann
python3,pyenv
Fügen Sie vorerst Python ein.
$ sudo apt-get install python
Ich denke, dass Python2.7 nur mit diesem installiert wird, also werde ich Pyenv fallen lassen, das die Version von Python verwaltet.
$ git clone https://github.com/yyuu/pyenv.git ~/.pyenv
Fügen Sie zur Verwendung von pyenv das folgende Skript zu einer Shell-Konfigurationsdatei wie .zshenv hinzu.
export PYENV_ROOT="$HOME/.pyenv"
export PATH=$PATH:$PYENV_ROOT/bin
eval "$(pyenv init -)"
** Nachtrag (11.12.2017) ** Ich habe die Exportreihenfolge umgekehrt. Dies kann nur korrekt durchgeführt werden, wenn PYENV_ROOT zuerst definiert und beim Definieren von PATH aufgerufen wird.
Ich verwende zsh, aber wenn ich Python aus einem als Datei gespeicherten Shell-Skript aufrufe, wird es zu Python2.7. Ich habe alle diese Einstellungen in .zshrc geschrieben, aber wenn Sie genau hinschauen, ist .zshrc eine Einstellung, die nur für den Stream gilt (wenn eine Person einen Befehl eingibt), nicht für ein Shell-Skript. Es scheint, dass. .zshenv ist eine Konfigurationsdatei, die immer ausgeführt wird, wenn zsh gestartet wird. Schreiben Sie alle Umgebungsvariablen in .zshenv.
Verwenden wir pyenv. Überprüfen Sie die Liste der Python-Versionen, die installiert werden können.
$ pyenv install -l
Nachdem Sie bestätigt haben, dass 3.5.0 vorhanden ist, installieren Sie Python 3.5.0, ändern Sie die Verwendungsversion und aktualisieren Sie. Wenn die endgültige Versionsprüfung 3.5.0 anzeigt, ist sie erfolgreich.
$ pyenv install 3.5.0
$ pyenv global 3.5.0
$ pyenv rehash
$ python --version
Installieren Sie dann das Bibliotheksverwaltungstool von Python, pip. Es wird in den nachfolgenden Einstellungen mehrmals verwendet.
$ sudo apt-get install python-pip
Referenz-URL Superschnelle Setup-Anleitung für Zsh-Anfänger http://qiita.com/uasi/items/c4288dd835a65eb9d709 Mindestnotizen bei Verwendung von Python auf Mac (pyenv edition) http://qiita.com/zaburo/items/dd1a8323633035614efc pyenv + virtualenv (CentOS7) http://qiita.com/saitou1978/items/e82421e29e118bd397cc Wenn Sie easy_install oder pip mit Python unter Ubuntu verwenden möchten http://tech.g.hatena.ne.jp/rx7/20101129/p1
MeCab
Installieren Sie MeCab und andere erforderliche Pakete.
$ sudo apt-get install mecab mecab-ipadic libmecab-dev
Wenn Sie mecab-ipadic einfügen, lautet der Zeichencode utf-8. Wenn libmecab-dev nicht enthalten ist, wird es Ärger verursachen, wenn mecab-config nicht enthalten ist. Die Wörterbücher, die mit MeCab verwendet werden können, umfassen ipadic und juman, aber dieses Mal werden wir mecab-ipadic-neologd verwenden. Das Merkmal dieses Wörterbuchs ist, dass es viele richtige Nomenklaturen, Symbole und Gesichtsbuchstaben enthält. Lassen Sie es uns mit dem folgenden Befehl installieren.
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git <Pfad zum Speichern des Speicherorts>
$ cd <Speicherort gespeichert>/mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -h
Ich denke, der Speicherort sollte der gleiche sein wie das vorhandene Wörterbuch. Sie können den Speicherort des Wörterbuchs finden, das Sie derzeit mit mecab -D
verwenden. Verwenden Sie dazu den folgenden Befehl.
mecab -d <Speicherort speichern> / mecab-ipadic-neologd /
Als nächstes binden Sie, damit MeCab von Python aus verwendet werden kann. Verwenden Sie den folgenden Befehl.
$ pip install mecab-python3
Wenn der folgende Befehl keinen Fehler enthält, ist er erfolgreich.
$ python
>>> import MeCab
Referenz-URL mecab-ipadic-NEologd : Neologism dictionary for MeCab https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md
CaboCha
Ich habe versucht, es wie zuvor mit dem folgenden Befehl zu installieren.
$ sudo apt-get install subversion
$ pip install 'svn+http://cabocha.googlecode.com/svn/trunk/python@r99'
Ich war wütend, dass ich das Paket nicht finden konnte. Ich habe verschiedene andere Methoden ausprobiert, aber am Ende habe ich beschlossen, sie mit der auf der offiziellen Website beschriebenen Methode zu löschen. Zuallererst die Bibliothek CRF ++, die für Cabocha benötigt wird, aber ich denke, es hat mit wget nicht funktioniert, also habe ich sie über den unten stehenden Link heruntergeladen.
CRF++ https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list
Ich ließ Cabocha selbst mit Wget fallen. Die Version ist am Verbindungsziel 0,67, aber setzen wir sie auf die neueste Version 0,69.
$ tar zvxf CRF++-0.58.tar.gz
$ cd CRF++-0.58
$ ./configure
$ make
$ sudo make install
$ sudo ldconfig
$ wget http://cabocha.googlecode.com/files/cabocha-0.69.tar.bz2
$ tar xjvf cabocha-0.69.tar.bz
$ cd cabocha-0.69
$ ./configure --with-charset=UTF8 --with-posset=IPA
$ make
$ sudo make install
$ sudo ldconfig
$ cabocha
Als nächstes binden Sie an Python3. Ändern Sie setup.py ein wenig, da python3 im ursprünglichen Zustand nicht unterstützt wird. setup.py befindet sich unter cabocha-69 / python.
setup.py
#Unterlassung
def cmd2(str):
# return string.split (cmd1(str))Löschen Sie diese Zeile
return cmd1(str).split() #Fügen Sie diese Zeile ein
#Unterlassung
Installieren Sie es nach dem Reparieren mit dem folgenden Befehl.
$ cd cabocha-0.69/python
$ sudo python setup.py build_ext
$ sudo python setup.py install
$ sudo ldconfig
Geben Sie bei Verwendung von Cabocha das Wörterbuch wie im folgenden Befehl angegeben an.
cabocha -d <Speicherort speichern> / mecab-ipadic-neologd /
Wenn der folgende Befehl keinen Fehler enthält, ist er erfolgreich.
$ python
>>> import CaboCha
Referenz-URL Offizielle CaboCha-Website https://taku910.github.io/cabocha/ Installationshinweise für Cabocha http://qiita.com/ShingoOikawa/items/ef4ac2929ec19599a3cf Ich habe einen Patch geschrieben, um CaboCha mit Python3 zu verwenden http://nosada.hatenablog.com/entry/2014/03/14/002954 Geben Sie das Wörterbuch mit CaboCha (Python) an. http://studylog.hateblo.jp/entry/2016/01/25/134507
gensim
Sie können es einfach mit dem folgenden Befehl installieren. numpy und scipy sind Bibliotheken, die für die Verwendung von gensim erforderlich sind.
$ pip install numpy
$ pip install scipy
$ pip install gensim
Überprüfen Sie wie im Beispiel, ob es mit dem folgenden Befehl installiert werden kann.
$ python
>>> import numpy
>>> import scipy
>>> import gensim
Referenz-URL gensim:installation https://radimrehurek.com/gensim/install.html
Damit sind die Umgebungseinstellungen abgeschlossen. Danke für deine harte Arbeit.
Die meisten von ihnen bezogen sich auf die Artikel, die ich zuvor in meinem eigenen Blog geschrieben habe.
Upgrade von Python2.7 auf 3.5 (NLP-Version) http://woody-kawagoe.hatenablog.com/entry/2016/04/18/222535
Ich war wieder süchtig danach und wollte verschiedene Dinge über Qiita schreiben, also habe ich es umgeschrieben und auf Qiita gepostet.
Recommended Posts