Outil de vérification orthographique du mot anglais (fabriqué par python)

Cela a toujours été un problème qu'il y ait beaucoup de faute de frappe en anglais dans les commentaires du patch (langage C) que j'ai écrit, j'ai donc créé un outil qui vérifie l'orthographe des mots anglais dans le commentaire en saisissant patch / diff Donc une note de celui-ci. Les commentaires au format C ou C ++ / * ・ ・ ・ * / peuvent être pris en charge.

La source est publiée sur github et le référentiel est ici.

Comment utiliser

$ git clone [email protected]:MasahikoSawada/Patch-Spell-Checker.git
$ export PATH=$PATH:/path/to/Patch-Spell-Checker/PatchSpellChecker.py
$ export WLIST_DIR=/path/to/Patch-Spell-Checker/wlist.d/

Si vous ne voulez pas le mettre dans la variable d'environnement WLIST_DIR, spécifiez-le avec -d chaque fois qu'il est exécuté.

 $ git diff | PatctSpellChecker.py
"xl_heap_lock" might be wrong at line 13.
        "+               * needed before releasing buffer. we can reuse xl_heap_lock "
"pupose" might be wrong at line 14.
        "+               * for this pupose. it should be fine even if we crash midway "
"combocids" might be wrong at line 45.
        "+                       * for logical decoding we need combocids to properly decode the "

-s(--source-file)Ajouter des options


$ PatctSpellChecker.py -f src/backend/postmaster/postmaster.c -s
"subprocess" might be wrong at line 11.
        " *       operations, mind you --- it just forks off a subprocess to do them "
"lock-manager" might be wrong at line 18.
        " *       and so it cannot participate in lock-manager operations.  keeping "

Fichier de dictionnaire

Il est possible d'enregistrer un nouveau mot en écrivant le mot dans le fichier * .dict dans la variable d'environnement WLIST_DIR. La précision de la vérification orthographique peut être améliorée en enregistrant des termes techniques. (Il existe une liste de mots gratuits sur le net, alors faites attention à la licence et enregistrez-vous.) Les formats acceptés par le fichier de dictionnaire sont les suivants.

Format de document


$ cat sentence.txt
PostgreSQL is a powerful open source object-relational database system.
It is fully ACID compliant, has full support for foreign keys, joins, views, triggers, and stored procedures.

Format Word


$ cat words.txt
PostgreSQL
is
a
ACID
database
system

Si vous souhaitez extraire des mots d'une source existante, utilisez l'option -s -w. Si vous combinez sort et ʻuniq`, vous pouvez obtenir les données de mot telles quelles.

$ PatchSpellChecker.py -f src/backend/postmaster/postmaster.c -s -w | sort | uniq
activity_buffer
addr
am_syslogger
antivirus
archiver
archive_recovery

Recommended Posts

Outil de vérification orthographique du mot anglais (fabriqué par python)
Impressions de toucher Dash, un outil de visualisation de données réalisé par python
Créez une application de mots anglais avec python
Un manuel pour les débutants réalisé par des débutants Python
[Python] Python et sécurité-② Outil d'analyse de port réalisé avec Python
Outil de rognage d'image GUI réalisé avec Python + Tkinter
[Traduction automatique] Outil d'aide à la saisie en anglais Translation-chan [Python]
# 1 Les débutants en Python créent des outils d'apprentissage de mots anglais simples
Séparer les chaînes de cas de chameau mot par mot en Python
vérification de la grammaire python
Procédure de la construction de l'environnement au test de fonctionnement de testinfra, un outil de test d'environnement de serveur réalisé par Python