Mac OS 10.9.4 Python 2.7
MeCab ist erforderlich, um CaboCha zu verwenden
Die neueste Version zum Zeitpunkt des Schreibens ist 0,58 http://crfpp.googlecode.com/svn/trunk/doc/index.html#download
Entpacken
$ cd CRF++-0.58
$ ./configure
$ make
$ make install
$ cd python
$ sudo python setup.py install
Die neueste Version zum Zeitpunkt des Schreibens ist 0.996 https://code.google.com/p/mecab/
Aus Downloads
--mecab-0.996.tar.gz (Mecab-Körper)
Herunterladen und entpacken.
$ cd mecab-0.996
$ ./configure
$ make
$ sudo make install
$ cd ..
$ cd mecab-python-0.996
$ sudo python setup.py install
$ cd ..
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure
$ make
$ sudo make install
Es gibt keine solche Datei oder kein solches Verzeichnis
Wenn es dir gesagt wird
#### **`sudo apt-get install python2.7-dev`**
```7-dev
Versuche dich zu bewegen
```bash
$ mecab
Ich bin Sakamoto und
Sakamoto? ????,????,*,*,*,*,*
?? ̾??,??ͭ̾??,?ȿ?,*,*,*,*
??Aber????,????,*,*,*,*,*
EOS
Die Charaktere sind verstümmelt. Es scheint, dass es nicht utf-8 ist, wenn der Zeichencode des Wörterbuchs die Standardeinstellung ist.
Wechseln Sie in das Verzeichnis mecab-ipadic und konfigurieren Sie es neu in UTF-8. Reinigen und dann neu konfigurieren
$ make clean
$ ./configure --with-charset=utf8
$ make
$ sudo make install
Ubuntu
libmecab.so.2: cannot open shared object file: No such file or directory
Wenn es dir gesagt wird
```sudo ldconfig ```
Es scheint gut zu sein
Versuchen Sie es.
```bash
$ mecab
Ich bin Sakamoto und
Sakamoto Substantiv,Proprietäre Nomenklatur,Name der Person,Nachname,*,*,Sakamoto,Sakamoto,Sakamoto
Ist ein Hilfsverb,*,*,*,Besonderer Tod,Grundform,ist,Tod,Tod
Ist ein Assistent,Verbindungsassistent,*,*,*,*,Aber,Ga,Ga
EOS
Fest.
Die Einstellung von Mecab ist übrigens in Mecabrc geschrieben.
$ sudo find / -name "mecabrc"
/usr/local/etc/mecabrc
$ sudo emacs /usr/local/etc/mecabrc
Es war standardmäßig so
;
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
;
dicdir = /usr/local/lib/mecab/dic/ipadic
; userdic = /home/foo/bar/user.dic
; output-format-type = wakati
; input-buffer-size = 8192
; node-format = %m\n
; bos-format = %S\n
; eos-format = EOS\n
Es scheint, dass dicdir ein Verzeichnis von Wörterbuchdaten ist.
Die neueste Version zum Zeitpunkt des Schreibens ist 0,68 https://code.google.com/p/cabocha/
Laden Sie cabocha-0.68.tar.bz2 von Downloads herunter und entpacken Sie es
$ cd cabocha-0.68
$ ./configure
$ make
$ sudo make install
$ cd pythin
$ sudo python setup.py install
import MeCab
mt = MeCab.Tagger("-Ochasen")
print mt.parse("Ich bin Sakamoto und")
Sakamoto Sakamoto Sakamoto Nomen-Proprietäre Nomenklatur-Name der Person-Nachname
Es ist der Tod. Hilfsverb Spezial / Tod Grundform
Gaga ist Assistentin-Verbindungsassistent
EOS
Es ist ärgerlich, dass ich nicht gehen kann, wenn ich nicht sehr vorsichtig mit dem Zeichencode bin.
# coding: utf-8
import MeCab
mt = MeCab.Tagger("mecabrc")
res = mt.parseToNode("Ich bin Sakamoto und")
while res:
print res.surface
print res.feature
res = res.next
BOS/EOS,*,*,*,*,*,*,*,*
Sakamoto
Substantiv,固有Substantiv,Name der Person,Nachname,*,*,Sakamoto,Sakamoto,Sakamoto
ist
Hilfsverb,*,*,*,Besonderer Tod,Grundform,ist,Tod,Tod
Aber
Partikel,接続Partikel,*,*,*,*,Aber,Ga,Ga
BOS/EOS,*,*,*,*,*,*,*,*
Es gab viele Implementierungen, die res.feature mit "," aufteilten, aber ich frage mich, ob es keine andere Wahl gibt, als dies zu tun. Nun, es scheint kein Problem zu sein, also werde ich es versuchen.
# coding: utf-8
import MeCab
mt = MeCab.Tagger("mecabrc")
res = mt.parseToNode("Ich bin Sakamoto und")
while res:
print res.surface
arr = res.feature.split(",")
print "Teil: " + arr[0]
res = res.next
Teil: BOS/EOS
Sakamoto
Teil:Substantiv
ist
Teil:Hilfsverb
Aber
Teil:Partikel
Teil: BOS/EOS
Wenn Sie nicht res = res.next anstelle von res.next setzen, werden Sie natürlich eine Endlosschleife ausführen. Ich bin süchtig nach Java.
Ich werde es wieder schreiben, wenn ich es versuche.
Recommended Posts