Cela a toujours été un problème qu'il y ait beaucoup de faute de frappe en anglais dans les commentaires du patch (langage C) que j'ai écrit, j'ai donc créé un outil qui vérifie l'orthographe des mots anglais dans le commentaire en saisissant patch / diff Donc une note de celui-ci.
Les commentaires au format C ou C ++ / * ・ ・ ・ * /
peuvent être pris en charge.
La source est publiée sur github et le référentiel est ici.
$ git clone [email protected]:MasahikoSawada/Patch-Spell-Checker.git
$ export PATH=$PATH:/path/to/Patch-Spell-Checker/PatchSpellChecker.py
$ export WLIST_DIR=/path/to/Patch-Spell-Checker/wlist.d/
Si vous ne voulez pas le mettre dans la variable d'environnement WLIST_DIR
, spécifiez-le avec -d
chaque fois qu'il est exécuté.
$ git diff | PatctSpellChecker.py
"xl_heap_lock" might be wrong at line 13.
"+ * needed before releasing buffer. we can reuse xl_heap_lock "
"pupose" might be wrong at line 14.
"+ * for this pupose. it should be fine even if we crash midway "
"combocids" might be wrong at line 45.
"+ * for logical decoding we need combocids to properly decode the "
"Pupose" est une faute de frappe "but". "xl_heap_lock" et "combocids" sont des mots non définis (détails ci-dessous)
Exemple d'exécution de vérification orthographique (exécutée sur un fichier source existant)
-s(--source-file)Ajouter des options
$ PatctSpellChecker.py -f src/backend/postmaster/postmaster.c -s
"subprocess" might be wrong at line 11.
" * operations, mind you --- it just forks off a subprocess to do them "
"lock-manager" might be wrong at line 18.
" * and so it cannot participate in lock-manager operations. keeping "
Il est possible d'enregistrer un nouveau mot en écrivant le mot dans le fichier * .dict
dans la variable d'environnement WLIST_DIR
. La précision de la vérification orthographique peut être améliorée en enregistrant des termes techniques.
(Il existe une liste de mots gratuits sur le net, alors faites attention à la licence et enregistrez-vous.)
Les formats acceptés par le fichier de dictionnaire sont les suivants.
Format de document
$ cat sentence.txt
PostgreSQL is a powerful open source object-relational database system.
It is fully ACID compliant, has full support for foreign keys, joins, views, triggers, and stored procedures.
Format Word
$ cat words.txt
PostgreSQL
is
a
ACID
database
system
Si vous souhaitez extraire des mots d'une source existante, utilisez l'option -s -w
. Si vous combinez sort
et ʻuniq`, vous pouvez obtenir les données de mot telles quelles.
$ PatchSpellChecker.py -f src/backend/postmaster/postmaster.c -s -w | sort | uniq
activity_buffer
addr
am_syslogger
antivirus
archiver
archive_recovery
Recommended Posts