Comparaison des modules de conversion japonais en Python3

Chao ... †

Le traitement du langage naturel est accompagné d'un prétraitement. Le prétraitement n'a jamais été rapide. J'ai donc comparé les modules de conversion japonais en Python3.

Éléments de comparaison

Conversion pleine largeur / demi-largeur et conversion de hiragana à katakana. Voir les chaînes cibles longues et courtes.

Comparaison

Résultat de la comparaison

Cliquez ici pour plus de détails

jaconv cnvk mojimoji zenhan rfZenHan mohayonao nkf
Phrases courtes de la demi-largeur à la pleine largeur 27.1 µs 96.4 µs 5.04 µs 75.8 µs 222 µs 23 µs
Longue phrase de la demi-largeur à la pleine largeur 89.9 ms 38.6 ms 23.1 ms 360 ms 237 ms 95.4 ms
Hiragana → Katakana pour des phrases courtes 18.1 µs 79.1 µs 25.4 µs 23.2 µs
Hiragana → Katakana pour de longues phrases 51.6 ms 41.8 ms 246 ms 98.6 ms

Mojimoji est rapide car j'utilise Cython. En Python pur, jaconv semble bien fonctionner dans les phrases courtes, et cnvk semble être bon dans les phrases longues.

Recommended Posts

Comparaison des modules de conversion japonais en Python3
comparaison du module de conversion de fichier exécutable python 2
Conversion de la chaîne <-> date (date, datetime) en Python
Sortie japonaise avec Python
J'ai écrit python en japonais
Comparaison d'objets nuls en Python
Mise à jour automatique du module Python
Stocker le japonais (chaîne de caractères multi-octets) dans sqlite3 de python
[python] Récupère la liste des classes définies dans le module
Jugement d'équivalence d'objet en Python
Comparaison de 4 types de frameworks Web Python
Je comprends Python en japonais!
Implémentation du tri rapide en Python
Exemple d'obtention du nom du module et du nom de la classe en Python
Obtenez des synonymes japonais avec Python
Comparaison du code de moyenne mobile exponentielle (EMA) écrit en Python
Comparaison de l'utilisation des fonctions d'ordre supérieur dans Python 2 et 3
Résolvez le problème japonais lors de l'utilisation du module CSV en Python.
Comparaison de la gestion des trames de données en Python (pandas), R, Pig
Manipulation des pixels d'image en Python
Diviser timedelta dans la série Python 2.7
Échappement automatique des paramètres MySQL en python
Gestion des fichiers JSON en Python
Implémentation du jeu de vie en Python
Affichage de la forme d'onde audio en Python
Exécuter le module Python unittest dans vs2017
La loi des nombres en python
Implémentation du tri original en Python
Comparaison de la vitesse de la perspective XML Python
Brouillage réversible d'entiers en Python
Comment gérer le japonais avec Python
Maîtriser le module lowref en Python
Vérifiez le comportement du destroyer en Python
Pratique d'utilisation de ceci en Python (mauvais)
Théorie générale de la relativité en Python: Introduction
Arborescence de sortie des fichiers en Python
Passez le chemin du module python importé
Afficher une liste d'alphabets en Python 3
Module d'implémentation de file d'attente et Python "deque"
Créer un diagramme de relations des modules Python
Résumé de diverses instructions for en Python
comparaison de chaînes python / utiliser 'list' et 'in' au lieu de '==' et 'ou'
Classe Trump en Python (avec comparaison)
Le résultat de l'installation de python sur Anaconda
Comparaison des solutions aux problèmes d'appariement de poids
Modèles Gang of Four (GoF) en Python
Vérifiez le chemin du module importé Python
Module pour générer le mot N-gramme en Python
R: Utilisez le japonais au lieu du japonais dans le script
Principes de base pour exécuter NoxPlayer en Python
Remplacement en bloc des chaînes dans les tableaux Python
Projet Euler # 16 "Somme des pouvoirs" en Python
Traffic Safety-kun: Reconnaissance des panneaux de signalisation en Python
Conversion des données de temps en notation 25 heures
ModuleNotFoundError en Python: aucun module nommé story
Résumé des méthodes intégrées, etc. de la liste Python
Utilisation d'opérateurs non logiques de ou en python
À la recherche du FizzBuzz le plus rapide en Python
Python: prétraitement dans l'apprentissage automatique: conversion de données