Für Sakura-Server WEB-Browser kompatibel mit UTF-8 Geben Sie das Ergebnis der morphologischen Analyse mit Mecab aus.
Die Programmiersprache wird mit python2.7 erklärt. Ich hoffe, es ist hilfreich, wenn Sie das Ausgabeergebnis von Mecab im WEB ausgeben.
Mecab selbst installieren und Mecab von Python aus aufrufen Siehe den vorherigen Artikel.
Installieren Sie mecab auf dem gemeinsam genutzten Sakura-Server und rufen Sie es von Python aus auf http://qiita.com/Jshirius/items/3a067486e2a693544c32
Der Zeichencode verwendet UTF-8. Der Zeichencode von Mecab ist standardmäßig "euc-jp", und ich war süchtig danach, das Ergebnis mit UTF-8 auszugeben. Hinterlassen Sie daher eine Notiz.
Voraussetzungen In diesem Artikel sind die folgenden Verzeichnisse die Wurzeln des Webs. /home/orehome/www/test
Wo soll das Programm abgelegt werden? /home/orehome/www/test/cgi-bin
Name der Quelldatei mecab_sample.py
(1) Schreiben Sie den Quellcode Schreiben Sie den folgenden Quellcode.
mecab_sample.py
#!/usr/bin/env python
# coding: UTF-8
import MeCab
#Geben Sie den Speicherort der Wörterbuchdatei mit dem vollständigen Pfad an (das Lesen ist aus irgendeinem Grund fehlgeschlagen, wenn es sich um einen relativen Pfad handelt).
userdic_path="-d /home/orehome/local/lib/mecab/dic/ipadic"
t = MeCab.Tagger("-Ochasen " + userdic_path)
text = u'Von den Oberschenkeln und Oberschenkeln'
#In utf8 konvertieren
encoded_text = text.encode('utf-8')
meData = t.parse(encoded_text )
#Zeilenvorschubcode<br>Umstellung auf
meData = meData.replace("\n","<br>")
html_body="""
<html><body>
Beispiel für Eingabezeichen:<br>%s
<br><br>
Morphologische Analyseergebnisse<br>
%s
</body></html>"""
print "Content-type: text/html\n"
#Verstümmelte Zeichen in Chrome ohne die folgenden Meta-Tags
print "<meta charset=utf-8 />"
print html_body % (encoded_text,meData)
Platzieren Sie den erstellten Quellcode an einer beliebigen Stelle auf dem Server. Da der Quellcode jedoch auf cgi ausgeführt wird, bewahren Sie ihn bitte im Verzeichnis cgi-bin auf.
Platzieren Sie in diesem Beispiel die Datei an folgendem Speicherort: /home/orehome/www/test/cgi-bin/mecab_sample.py
(2) Ändern Sie die zu aktivierende Zugriffsberechtigung
Machen Sie die Zugriffsberechtigung ausführbar.
Wenn Sie dies vergessen und auf die WEB-Seite zugreifen, wird der Browser dies tun
Es wurde weiß und es dauerte eine Stunde, bis es gelöst war ...
chmod 755 mecab_sample.py
(3) Starten Sie den Python-WEB-Server Wechseln Sie zur nächsthöheren Ebene von "cgi-bin" und geben Sie den folgenden Befehl ein, um den Server auszuführen. Gehen Sie für diesen Artikel zu / home / orehome / www / test und geben Sie den folgenden Befehl ein:
python -m CGIHTTPServer
So halten Sie den Server auch nach dem Abmelden am Laufen
nohup python -m CGIHTTPServer &
~~ * Ich weiß nicht, ob die Methode zur Verwendung von nohup in einer Produktionsumgebung korrekt ist. Wenn jemand weiß, lass es mich wissen! ~~
Hinzugefügt am 18. April 2017 Wenn Sie in einer Produktionsumgebung arbeiten, sind die folgenden Materialien hilfreich! Versuchen Sie, das einfache PYTHON CGI mit Sakura (Einstellungen) zu verschieben. http://www.mwsoft.jp/programming/python/sakura/010_010.html
(4) Funktionsprüfung des WEB-Browsers Meine Umgebung verwendet Python2.7. Klicken Sie in Ihrem Browser auf die entsprechende URL.
http://domain_name:8000/cgi-bin/mecab_sample.py
Wenn es richtig funktioniert, wird es wie folgt angezeigt.
Recommended Posts