Es ist ein "japanischer Syntaxanalysator". Du kannst das.
--Fall Analyse
Vorheriger Artikel als Referenz
Zum Zeitpunkt der DNN-Epidemie fragen Sie sich möglicherweise: "Analysieren Sie noch?" Tatsächlich wurde bereits gezeigt, dass das entwickelte RNN die höchste Genauigkeit bei der Schätzung der Bewertung bietet (http://www.slideshare.net/hirokiouchi5/ss-70436298). Tatsächlich ist der Quellcode auch für die Öffentlichkeit zugänglich, daher denke ich, dass es in Ordnung ist, hierher zu gehen.
KNP ist jedoch immer noch das am häufigsten analysierte Ziel. pdf) und KNP ist einfach als Werkzeug zu verwenden, da es nicht nur Fallanalysen, sondern auch Syntaxinformationen aus morphologischen Informationen anzeigt.
Nachdem Sie sich bei Pypi registriert haben, können Sie es mit pip
installieren.
pip install knp-utils
Es ist schneller. Der Unterschied nimmt tendenziell zu, wenn die Anzahl der Eingabedokumente zunimmt. Die folgenden Zahlen sind Vergleiche für 40 Dokumente.
Übrigens sind "pexpect" und "everytime" Modusnamen, die Human- und KNP-Prozesse innerhalb von Multithreading verarbeiten.
pexpect
lässt den Human & KNP-Prozess laufen.
everytime
startet Human & KNP für jeden Eingabetext.
pexpect mode, finished with :44.13979196548462[sec]
everytime mode, finished with :38.31942701339722[sec]
pyknp, finished with :64.74086809158325[sec]
Zeitvergleich beim Kombinieren von Juman ++ & KNP. Juman ++ (1.02) soll "langsam sein, was ist das?" Dies liegt daran, dass das Laden der Modelldatei beim Starten des Prozesses einige Zeit in Anspruch nimmt.
Wenn Sie den Prozess also laufen lassen, ist er schneller. Es ist eine einfache Geschichte.
pexpect mode, finished with :48.096940994262695[sec]
everytime mode, finished with :64.07872700691223[sec]
pyknp, finished with : 602.032340992232452[sec]
Es wird nur der folgende Vorgang wiederholt.
Haben Sie ein schnelles, einfaches und unterhaltsames Leben mit Syntaxanalysen!
[^ 1]: 40 Unterschiede zwischen Dokumenten. Je mehr Dokumente Sie eingeben, desto schneller wird es. [^ 2]: Multiprozess ist schneller, aber ich habe einen Fehler erhalten und es hat nicht funktioniert (´ ・ ω ・ `)
Recommended Posts