Es war schon immer ein Problem, dass die Kommentare in dem Patch (C-Sprache), den ich geschrieben habe, viele englische Tippfehler enthalten. Deshalb habe ich ein Tool erstellt, das die Rechtschreibung der englischen Wörter im Kommentar durch Eingabe von patch / diff überprüft Also eine Notiz davon.
Kommentare im Format C oder C ++ / * ・ ・ ・ * /
können unterstützt werden.
Die Quelle wird auf github veröffentlicht und das Repository ist hier.
$ git clone [email protected]:MasahikoSawada/Patch-Spell-Checker.git
$ export PATH=$PATH:/path/to/Patch-Spell-Checker/PatchSpellChecker.py
$ export WLIST_DIR=/path/to/Patch-Spell-Checker/wlist.d/
Wenn Sie es nicht in die Umgebungsvariable WLIST_DIR
einfügen möchten, geben Sie es bei jeder Ausführung mit -d
an.
$ git diff | PatctSpellChecker.py
"xl_heap_lock" might be wrong at line 13.
"+ * needed before releasing buffer. we can reuse xl_heap_lock "
"pupose" might be wrong at line 14.
"+ * for this pupose. it should be fine even if we crash midway "
"combocids" might be wrong at line 45.
"+ * for logical decoding we need combocids to properly decode the "
"Pupose" ist ein "Zweck" Tippfehler. "xl_heap_lock" und "combocids" sind undefinierte Wörter (Details unten)
Beispiel für die Ausführung der Rechtschreibprüfung (wird in einer vorhandenen Quelldatei ausgeführt)
-s(--source-file)Optionen hinzufügen
$ PatctSpellChecker.py -f src/backend/postmaster/postmaster.c -s
"subprocess" might be wrong at line 11.
" * operations, mind you --- it just forks off a subprocess to do them "
"lock-manager" might be wrong at line 18.
" * and so it cannot participate in lock-manager operations. keeping "
Es ist möglich, ein neues Wort zu registrieren, indem das Wort in die Datei "* .dict" in der Umgebungsvariablen "WLIST_DIR" geschrieben wird. Die Genauigkeit der Rechtschreibprüfung kann durch die Registrierung von Fachbegriffen verbessert werden. (Es gibt eine kostenlose Wortliste im Internet. Seien Sie also vorsichtig mit der Lizenz und registrieren Sie sich.) Die von der Wörterbuchdatei akzeptierten Formate lauten wie folgt.
--Dokumentenformat (kostenlose englische Dokumente können so wie sie sind veröffentlicht werden)
Dokumentformat
$ cat sentence.txt
PostgreSQL is a powerful open source object-relational database system.
It is fully ACID compliant, has full support for foreign keys, joins, views, triggers, and stored procedures.
--Wortformat (nützlich bei der Definition Ihrer eigenen Fachbegriffe)
Word-Format
$ cat words.txt
PostgreSQL
is
a
ACID
database
system
Wenn Sie Wörter aus einer vorhandenen Quelle extrahieren möchten, verwenden Sie die Option -s -w
. Wenn Sie sort
und uniq
kombinieren, können Sie Wortdaten so wie sie sind erstellen.
$ PatchSpellChecker.py -f src/backend/postmaster/postmaster.c -s -w | sort | uniq
activity_buffer
addr
am_syslogger
antivirus
archiver
archive_recovery
Recommended Posts