Dieser Artikel ist eine Erinnerung / ein Memo beim Lesen von Vorverarbeitung in natürlicher Sprache.
Numerische Werte werden ebenfalls normalisiert, sodass 99 und 1,235 auf 0 gesetzt werden. Sicherlich scheint es nichts mit dem zu tun zu haben, was Sie mit der Verarbeitung natürlicher Sprache analysieren möchten.
Es ist nicht darauf beschränkt, aber es wäre schön, ein Codebeispiel zu haben. Außerdem ist die Auswahl eines Stoppworts genau das Richtige für die Überprüfung anhand von Bedeutung und Häufigkeit.
Der Ausführungszeitunterschied ist groß. Ist es nicht wichtiger als Genauigkeit?
Recommended Posts