Erstellen Sie eine Umgebung mit 64-Bit-Windows + Python 2.7 + MeCab 0.996

Korrekturgeschichte

19.02.2016 Codekorrektur / erforderliche Dateiaktualisierung 19.02.2016 Zusätzliche Fehlerbehebung

Einführung

Warum überhaupt in Windows? Ich denke, es gibt eine Geschichte, aber es gibt einen Grund. Windows hat eine leistungsstarke IDE, Visual Studio.

Code-Vervollständigung, Snippets, Debugging ... Obwohl es sich um eine IDE handelt, die viele Vorteile hat, gibt es viele Schwierigkeiten beim Erstellen einer Umgebung unter Windows, und es scheint, dass Python-bezogene Probleme häufig Build-Probleme verursachen. Es gibt verschiedene Gründe, aber die Unix-Befehle funktionieren nicht und der Dateipfad ist anders geschrieben.

Dieses Mal werden wir eine solche Hürde überwinden und die Python-Bibliothek von MeCab installieren, die bei Prozessoren für natürliche Sprachen beliebt ist.

__Was ist MeCab? __ __ [MeCab] [* 0] ist ein morphologisches Analysewerkzeug. Morphologische Elemente bedeuten so etwas wie den kleinsten Block bedeutungsvoller Wörter. Beispielsweise kann "separates Schreiben mit Python" in "separates Schreiben mit Python" zerlegt werden. Darüber hinaus ist es multifunktional, z. B. das Analysieren von Teilwörtern und das Wiederherstellen des Prototyps. Es ist wunderbar. Es gibt andere morphologische Analysewerkzeuge wie [JUMAN] [* 1] und [KAKASI] [* 2] von der Universität Kyoto.

Dinge notwendig

Dinge die zu tun sind

Grundsätzlich finden Sie in beiden Artikeln [mecab-python -Python] [* 3] [Build MeCab für 64-Bit-Windows (mit Visual Studio 2010) -iPentec] [* 4] unter Windows 64bit. Ich werde fortfahren. Vielen Dank. .. .. ..

  1. Installieren Sie MeCab mit dem Installationsprogramm mecab-0.996.exe
  2. Ändern Sie teilweise die Quelle von mecab-0.996.tar.gz, erstellen Sie sie und ersetzen Sie die erstellte durch den Inhalt des installierten MeCab.
  3. Schreiben Sie das Skript von mecab-python-0.996.tar.gz für Windows neu und führen Sie Build und Setup aus

Es scheint einfach so zu schreiben!

1. Installieren Sie MeCab

Installation von MeCab selbst. Sie müssen lediglich das Installationsprogramm ausführen und die Umgebungsvariablen schreiben.

  1. Laden Sie [mecab-0.996.exe] herunter und führen Sie es aus (http://taku910.github.io/mecab/#download). Der Zeichencode des Wörterbuchs scheint vielseitig zu sein, deshalb habe ich utf-8 gewählt. Utf-8 ist jedoch an der Eingabeaufforderung verstümmelt. Seien Sie also nicht überrascht.
  2. Fügen Sie der Umgebungsvariablen PATH C: \ Mecab \ bin hinzu.
  3. Erstellen Sie eine neue Umgebungsvariable MECABRC und setzen Sie C: \ MeCab \ etc \ mecabrc

Umgebungsvariablen ändern sich je nach Installationsziel. Überprüfen Sie dies daher selbst.

2. Ändern und erstellen Sie die MeCab-Quelle

Ändern und erstellen Sie die Quelldatei. Da es sich um 32-Bit handelt, beheben Sie es für 64-Bit. Danach habe ich etwas behoben, das ein kleiner Fehler zu sein scheint.

  1. Erweitern Sie mecab-0.996.tar.gz.
  2. Einige Dateien im Ordner mecab-0.996 \ src wurden behoben. Machen Sie den Installationsordner zu Ihrer eigenen Umgebung. (Löschen Sie die Zeile "#" und fügen Sie nach "!>" Hinzu.)

<! LDFLAGS = /nologo /OPT:REF /OPT:ICF /LTCG /NXCOMPAT /DYNAMICBASE /MACHINE:X86 ADVAPI32.LIB !>LDFLAGS = /nologo /OPT:REF /OPT:ICF /LTCG /NXCOMPAT /DYNAMICBASE /MACHINE:X64 ADVAPI32.LIB ```

<! -DDLL_EXPORT -DHAVE_GETENV -DHAVE_WINDOWS_H -DDIC_VERSION=@DIC_VERSION@
!>-DDLL_EXPORT -DHAVE_GETENV -DHAVE_WINDOWS_H -DDIC_VERSION=102 \ ```

<! -DVERSION=""@VERSION@"" -DPACKAGE=""mecab""
!>-DVERSION=""0.996"" -DPACKAGE=""mecab""
```

<! -DMECAB_DEFAULT_RC=""c:\Program Files\mecab\etc\mecabrc"" !>-DMECAB_DEFAULT_RC=""d:\Programs\mecab\etc\mecabrc"" ```

<! case 't': os_ << (size_t)path->rnode->char_type; break; !>case 't': os_ << (unsigned int)path->rnode->char_type; break; ```

<! case 'L': *os << lattice->size(); break; !>case 'L': *os << (unsigned int)lattice->size(); break; ```

<! #ifndef SIWG !>#ifndef SWIG ```

!>#include ```

  1. Bauen. Führen Sie den Ordner mecab-0.996 \ src aus. Es scheint, dass die Eingabeaufforderung mit Administratorrechten gestartet werden sollte.

call "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\vcvarsall.bat" amd64 nmake -f Makefile.msvc.in ```

  1. "libmecab.dll", "mecab-cost-train.exe", "mecab-dict-gen.exe", "mecab-dict-index.exe", "mecab-system in MeCab \ bin des Mecab-Körpers" Kopie von -eval.exeundmecab-test-gen.exe` überschreiben.
  2. Überschreiben Sie mecab.h und libmecab.lib in MeCab \ sdk der MeCab-Haupteinheit. Kopieren Sie dieselbe Datei auch in den Ordner mecab-python-0.996. (* Notwendige Schritte aktualisiert)

Das war's für den Bau von MeCab! Es ist ein ziemliches Problem, weil verschiedene Leute verschiedene Dinge sagen.

__Ergänzung __ ~~ 5. ist ausreichend, aber möglicherweise nicht das erforderliche Minimum. Ich werde es zu einem späteren Zeitpunkt erneut überprüfen ~~ (Bestätigt! Siehe oben.)

3. Einrichtung von Mecab für Python

Endlich Python! Es gibt ein Skript, das nur unter Unix funktioniert. Schreiben wir es also für Windows neu.

  1. Extrahieren Sie mecab-python-0.996.tar.gz

  2. Schreiben Sie setup.py wie folgt neu. Bitte ändern Sie das Installationsziel entsprechend.

#!/usr/bin/env python from distutils.core import setup,Extension,os setup(name = "mecab-python", version = "0.996", py_modules=["MeCab"], ext_modules = [ Extension("_MeCab", ["MeCab_wrap.cxx",], include_dirs=[r"C:\MeCab\sdk"], library_dirs=[r"C:\MeCab\sdk"], libraries=["libmecab"]) ]) ```

  1. Bauen. Erstellen Sie einen Build-Ordner

python setup.py build running build running build_py running build_ext building '_MeCab' extension C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\BIN\amd64\cl.exe /c /nolo go /Ox /MD /W3 /GS- /DNDEBUG -ID:\Programs\MeCab\sdk -IC:\Develop\python27\inclu de -IC:\Develop\python27\PC /TpMeCab_wrap.cxx /Fobuild\temp.win-amd64-2.7\Releas e\MeCab_wrap.obj MeCab_wrap.cxx MeCab_wrap.cxx(3747) : warning C4530: C++Ich verwende die Ausnahmebehandlung, aber entspanne mich Semantik ist nicht aktiviert./Bitte geben Sie EHsc an. C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\BIN\amd64\link.exe /DLL /nologo /INCREMENTAL:NO /LIBPATH:D:\Programs\MeCab\sdk /LIBPATH:C:\Develop\python27\libs /LIBPATH:C:\Develop\python27\PCbuild\amd64 libmecab.lib /EXPORT:init_MeCab build\temp.win-amd64-2.7\Release\MeCab_wrap.obj /OUT:build\lib.win-amd64-2.7_MeCab.pyd /IMPLIB:build\temp.win-amd64-2.7\Release_MeCab.lib/MANIFESTFILE:build\temp.win-amd64-2.7\Release_MeCab.pyd.manifest MeCab_wrap.obj : warning LNK4197:Export'init_MeCab'Wird mehrfach angegeben. Wenden Sie die allererste Spezifikation an. Bibliotheksaufbau\temp.win-amd64-2.7\Release_MeCab.lib und object build\t emp.win-amd64-2.7\Release_MeCab.Erstellen von exp ```

  1. Installation. Verschiedene Dateien werden in Lib \ site-Pakete kopiert, in denen Python installiert ist

python setup.py install running install running build running build_py running build_ext running install_lib copying build\lib.win-amd64-2.7\MeCab.py -> C:\Develop\python27\Lib\site-packages copying build\lib.win-amd64-2.7_MeCab.pyd -> C:\Develop\python27\Lib\site-packages byte-compiling C:\Develop\python27\Lib\site-packages\MeCab.py to MeCab.pyc running install_egg_info Writing C:\Develop\python27\Lib\site-packages\mecab_python-0.996-py2.7.egg-info ```

Damit ist das Python-Setup abgeschlossen! Wie beim vorherigen Verfahren ist es aufgrund der unterschiedlichen Spezifikationen zwischen dem Unix-Terminal und der Eingabeaufforderung erforderlich, die Version und das Installationsziel direkt anzugeben.

Fehlerbehebung

__1. In python setup.py build wird es Fehler: vcvarsall.bat kann nicht gefunden werden __ Ich kann die Visual Studio-Datei scheinbar nicht lesen. Siehe [Stapelüberlauf] [* 5].

SET VS90COMNTOOLS=%VS140COMNTOOLS%`

Wenn Sie so etwas tun, sollte es funktionieren. VS14 für Visual Studio 2015. Für Visual Studio 2014 ist es VS13, verwirrend, aber seien Sie vorsichtig.

__2. Es gibt überhaupt keine vcvarsall.bat ... __ Lassen Sie uns Visual Studio reparieren und installieren. Starten Sie das Visual Studio-Installationsprogramm. Wenn Sie es bereits installiert haben, sollte es ein Element namens "Ändern" geben. Gehen Sie also zu Programmiersprache-> Visual C ++ und überprüfen Sie es. Drücken Sie dann Aktualisieren.

2016-02-19.png

Das sollte in Ordnung sein.

Prüfung

Wenn alles erledigt ist, können Sie endlich MeCab verwenden! Lass es uns sofort versuchen

test.txt


Hallo. Ich bin Baymax. Schützen Sie Ihre Gesundheit.

Bereiten Sie zunächst die obige Testdatei vor. Und mit Python,

> python
Python 2.7.9 (default, Dec 10 2014, 12:28:03) [MSC v.1500 64 bit (AMD64)] on win
32
Type "help", "copyright", "credits" or "license" for more information.
>>> import MeCab
>>> import sys
>>> m = MeCab.Tagger("-Owakati")
>>> f = open('test.txt','r')
>>> text = f.read().decode('utf-8')
>>> f.close()
>>> f = open('test.txt','w')
>>> f.write(m.parse(text.encode('utf-8')))
>>> f.close()

so was!

Dann die Testdatei, die ich zuvor erwähnt habe

Hallo . Ich bin Bay Max. Schützen Sie Ihre Gesundheit.

Wir sehen uns! Es ist richtig geschrieben! Aufgrund des MeCab-Wörterbuchs ist Baymax jedoch aufgeteilt. .. .. .. .. .. ..

__ (• ー •) <Benötigen Sie wirklich einen Pflegeroboter, der die morphologische Analyse korrekt durchführen kann? __ __

Sie sollten es können! Fügen wir also das nächste Mal ein Wörterbuch hinzu.

Referenz

MeCab: Yet Another Part-of-Speech and Morphological Analyzer [KAKASI - Kanji → Kana (Romaji) Konvertierungsprogramm] [* 1] [Japanisches morphologisches Analysesystem JUMAN] [* 2] [Windows 64bit, Mecab-Python-Python] [* 3] [MeCab für 64-Bit-Windows erstellen (mit Visual Studio 2010) -iPentec] [* 4] Was blieb bei der Einführung von MeCab Python Add Star hängen - Beginn des Data Mining und des maschinellen Lernens stack overflow -error: Unable to find vcvarsall.bat

<! - Referenzliste->

Recommended Posts

Erstellen Sie eine Umgebung mit 64-Bit-Windows + Python 2.7 + MeCab 0.996
Setzen Sie MeCab in "Windows 10; Python3.5 (64bit)"
Python2.7-Installation in einer Windows 32-Bit-Umgebung
[Django] Memo zum Erstellen einer Umgebung von Django + MySQL + Vue.js [Python]
Python Windows-Umgebung
Erstellen Sie eine OpenCV3 + python3-Umgebung unter OSX
Einführung der Bindung von MeCab (Wafubu) und Python an Windows 7 64bit (18.08.2016)
Vereinheitlichung der Python-Umgebung
[Python] Erstellen Sie eine asynchrone Taskausführungsumgebung + Überwachungsumgebung
Erstellen Sie eine Python-Umgebung
Erstellen Sie eine komfortable Python 3 (Anaconda) -Entwicklungsumgebung mit Windows
[Python] [Windows] Speichern Sie einen Screenshot als Bild
Erstellen Sie eine Open AI Gym-Umgebung mit Bash unter Windows 10
Erstellen Sie unter Windows eine anständige Shell- und Python-Umgebung
Aufbau einer Python-Umgebung (Windows 10 + Emacs)
Erstellen Sie eine Python-Umgebung unter Windows
Erstellen Sie eine Python-Umgebung mit Windows
Erstellen einer Python-Umgebung unter Windows 7
Umgebungskonstruktion von Python2 & 3 (OSX)
Erstellen Sie mit PyInstaller eine exe-Datei, die in einer Windows-Umgebung ohne Python funktioniert
Übersicht über die virtuelle Python-Umgebung und deren Erstellung
Umgebungskonstruktion von Python und OpenCV
Python-Umgebungskonstruktionsnotiz unter Windows 10
Installieren von Kivy unter Windows 10 64bit Python3.5
Aufbau einer Anaconda-Python-Umgebung unter Windows 10
Python studieren Teil 1 Erstellen einer Umgebung
Erstellen Sie eine Python-Umgebung auf dem Mac (2017/4)
Erstellen Sie eine virtuelle Umgebung mit Python!
[Python3] Aufbau der Entwicklungsumgebung << Windows Edition >>
Windows 10: Installieren der MeCab-Bibliothek für Python
Installieren von Kivy-Designer unter Windows 10 64-Bit Python3.5
Erstellen Sie eine Linux-Umgebung unter Windows 10
Erstellen Sie mlpy mit python3.3 (64bit) (Windows 64bit)
Mecab / Cabocha / KNP unter Python + Windows
Erstellen Sie eine Python-Umgebung in Centos
Installation von Python, SciPy, matplotlib (Windows)
Erstellen einer Umgebung für Python3.8 auf einem Mac
Installieren Sie die Python-Entwicklungsumgebung unter Windows 10
Wettbewerb mit VS-Code Erstellen Sie eine Python-Umgebung für Profis unter Windows
Erstellen Sie eine Windows Python-Ausführungsumgebung mit VScode + Remote WSL
[Docker] Erstellen Sie eine Umgebung für Python (Flask) + GraphQL (Graphen) + MySQL (SQLalchemy)
Erstellen Sie eine andere Version der Python-Conda-Umgebung mit einer Befehlszeile
Ich habe versucht, eine Umgebung von MkDocs unter Amazon Linux zu erstellen
Beispiel für die Erstellung einer Python-Entwicklungsumgebung unter Windows (wsl2, vscode, pipenv)
Morphologische Analyse von Sätzen mit aktuellen Wörtern in der Windows10 64-Bit-Umgebung
Verschiedene Möglichkeiten, um in Python ein Array von Zahlen von 1 bis 10 zu erstellen.
[Python] Erstellen einer Umgebung mit Anaconda [Mac]
[Definitive Edition] Erstellen einer Umgebung zum Erlernen des "maschinellen Lernens" mit Python unter Windows
Ändern Sie die Python 64-Bit-Umgebung mit Anaconda in eine 32-Bit-Umgebung
Erstellen Sie eine Umgebung für das in Blender integrierte Python
Build-Umgebung für Python 2.7, 3.4, 3.5-Erweiterungsmodule unter Windows
Konstruktionsverfahren für die Python-Projektumgebung (für Windows)
Verwenden von venv in der Windows + Docker-Umgebung [Python]
So erstellen Sie eine NVIDIA Docker-Umgebung