Vergleich japanischer Konvertierungsmodule in Python3

Chao ... †

Die Verarbeitung natürlicher Sprache wird von einer Vorverarbeitung begleitet. Die Vorverarbeitung war noch nie so schnell. Also habe ich die japanischen Konvertierungsmodule in Python3 verglichen.

Vergleichselemente

Umwandlung in voller / halber Breite und Umwandlung von Hiragana in Katakana. Siehe sowohl lange als auch kurze Zielzeichenfolgen.

Vergleich

Vergleichsergebnis

Klicken Sie hier für Details

jaconv cnvk mojimoji zenhan rfZenHan mohayonao nkf
Kurze Sätze von halber bis voller Breite 27.1 µs 96.4 µs 5.04 µs 75.8 µs 222 µs 23 µs
Langer Satz von halber bis voller Breite 89.9 ms 38.6 ms 23.1 ms 360 ms 237 ms 95.4 ms
Hiragana → Katakana für kurze Sätze 18.1 µs 79.1 µs 25.4 µs 23.2 µs
Hiragana → Katakana für lange Sätze 51.6 ms 41.8 ms 246 ms 98.6 ms

Mojimoji ist schnell, weil ich Cython benutze. In Pure Python scheint jaconv in kurzen Sätzen gut zu funktionieren, und cnvk scheint in langen Sätzen gut zu sein.

Recommended Posts

Vergleich japanischer Konvertierungsmodule in Python3
Vergleich der Konvertierungsmodule für ausführbare Python-Dateien 2
Konvertierung der Zeichenfolge <-> Datum (Datum, Datum / Uhrzeit) in Python
Japanische Ausgabe mit Python
Ich habe Python auf Japanisch geschrieben
Nullobjektvergleich in Python
Automatisches Update des Python-Moduls
Speichern Sie Japanisch (Multibyte-Zeichenfolge) in sqlite3 von Python
[Python] Ruft die Liste der im Modul definierten Klassen ab
Objektäquivalenzbeurteilung in Python
Vergleich von 4 Arten von Python-Webframeworks
Ich verstehe Python auf Japanisch!
Implementierung der schnellen Sortierung in Python
Beispiel für das Abrufen des Modulnamens und des Klassennamens in Python
Holen Sie sich japanische Synonyme mit Python
Vergleich des in Python geschriebenen EMA-Codes (Exponential Moving Average)
Vergleich der Verwendung von Funktionen höherer Ordnung in Python 2 und 3
Lösen Sie das japanische Problem, wenn Sie das CSV-Modul in Python verwenden.
Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig
Bildpixel-Manipulation in Python
Zeitdelta in Python 2.7-Serie teilen
MySQL-automatische Escape-Funktion von Parametern in Python
Umgang mit JSON-Dateien in Python
Implementierung eines Lebensspiels in Python
Audio-Wellenform-Anzeige in Python
Führen Sie das Python-Unittest-Modul in vs2017 aus
Das Gesetz der Zahlen in Python
Implementierung der ursprünglichen Sortierung in Python
Geschwindigkeitsvergleich der Python-XML-Perspektive
Reversibles Verwürfeln von Ganzzahlen in Python
Umgang mit Japanisch mit Python
Beherrsche das schwache Ref-Modul in Python
Überprüfen Sie das Verhalten des Zerstörers in Python
Übung, dies in Python zu verwenden (schlecht)
Allgemeine Relativitätstheorie in Python: Einführung
Ausgabebaumstruktur von Dateien in Python
Übergeben Sie den Pfad des importierten Python-Moduls
Zeigen Sie eine Liste der Alphabete in Python 3 an
Warteschlangen- und Python-Implementierungsmodul "deque"
Erstellen Sie ein Beziehungsdiagramm von Python-Modulen
Zusammenfassung verschiedener for-Anweisungen in Python
Python-String-Vergleich / benutze 'Liste' und 'In' anstelle von '==' und 'oder'
Trump-Klasse in Python (mit Vergleich)
Das Ergebnis der Installation von Python auf Anaconda
Vergleich von Lösungen bei Gewichtsanpassungsproblemen
Gang of Four (GoF) -Muster in Python
Überprüfen Sie den Pfad des importierten Python-Moduls
Modul zum Generieren des Wortes N-Gramm in Python
R: Verwenden Sie im Skript Japanisch anstelle von Japanisch
Grundlagen zum Ausführen von NoxPlayer in Python
Massenersatz von Zeichenfolgen in Python-Arrays
Projekt Euler # 16 "Summe der Kräfte" in Python
Traffic Safety-Kun: Erkennung von Verkehrszeichen in Python
Konvertierung von Zeitdaten in 25-Uhr-Notation
ModuleNotFoundError in Python: Kein Modul mit dem Namen story
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Nicht logische Operatorverwendung von oder in Python
Auf der Suche nach dem schnellsten FizzBuzz in Python
Python: Vorverarbeitung beim maschinellen Lernen: Datenkonvertierung