Englisch Wort Rechtschreibprüfung Tool (von Python gemacht)

Es war schon immer ein Problem, dass die Kommentare in dem Patch (C-Sprache), den ich geschrieben habe, viele englische Tippfehler enthalten. Deshalb habe ich ein Tool erstellt, das die Rechtschreibung der englischen Wörter im Kommentar durch Eingabe von patch / diff überprüft Also eine Notiz davon. Kommentare im Format C oder C ++ / * ・ ・ ・ * / können unterstützt werden.

Die Quelle wird auf github veröffentlicht und das Repository ist hier.

Wie benutzt man

$ git clone [email protected]:MasahikoSawada/Patch-Spell-Checker.git
$ export PATH=$PATH:/path/to/Patch-Spell-Checker/PatchSpellChecker.py
$ export WLIST_DIR=/path/to/Patch-Spell-Checker/wlist.d/

Wenn Sie es nicht in die Umgebungsvariable WLIST_DIR einfügen möchten, geben Sie es bei jeder Ausführung mit -d an.

 $ git diff | PatctSpellChecker.py
"xl_heap_lock" might be wrong at line 13.
        "+               * needed before releasing buffer. we can reuse xl_heap_lock "
"pupose" might be wrong at line 14.
        "+               * for this pupose. it should be fine even if we crash midway "
"combocids" might be wrong at line 45.
        "+                       * for logical decoding we need combocids to properly decode the "

-s(--source-file)Optionen hinzufügen


$ PatctSpellChecker.py -f src/backend/postmaster/postmaster.c -s
"subprocess" might be wrong at line 11.
        " *       operations, mind you --- it just forks off a subprocess to do them "
"lock-manager" might be wrong at line 18.
        " *       and so it cannot participate in lock-manager operations.  keeping "

Wörterbuchdatei

Es ist möglich, ein neues Wort zu registrieren, indem das Wort in die Datei "* .dict" in der Umgebungsvariablen "WLIST_DIR" geschrieben wird. Die Genauigkeit der Rechtschreibprüfung kann durch die Registrierung von Fachbegriffen verbessert werden. (Es gibt eine kostenlose Wortliste im Internet. Seien Sie also vorsichtig mit der Lizenz und registrieren Sie sich.) Die von der Wörterbuchdatei akzeptierten Formate lauten wie folgt.

--Dokumentenformat (kostenlose englische Dokumente können so wie sie sind veröffentlicht werden)

Dokumentformat


$ cat sentence.txt
PostgreSQL is a powerful open source object-relational database system.
It is fully ACID compliant, has full support for foreign keys, joins, views, triggers, and stored procedures.

--Wortformat (nützlich bei der Definition Ihrer eigenen Fachbegriffe)

Word-Format


$ cat words.txt
PostgreSQL
is
a
ACID
database
system

Wenn Sie Wörter aus einer vorhandenen Quelle extrahieren möchten, verwenden Sie die Option -s -w. Wenn Sie sort und uniq kombinieren, können Sie Wortdaten so wie sie sind erstellen.

$ PatchSpellChecker.py -f src/backend/postmaster/postmaster.c -s -w | sort | uniq
activity_buffer
addr
am_syslogger
antivirus
archiver
archive_recovery

Recommended Posts

Englisch Wort Rechtschreibprüfung Tool (von Python gemacht)
Impressionen von Touch, einem von Python erstellten Datenvisualisierungstool
Erstellen Sie eine englische Wort-App mit Python
Ein Lehrbuch für Anfänger von Python-Anfängern
[Python] Python und Sicherheit - Port-Scan-Tool mit Python
GUI-Bildschneidewerkzeug mit Python + Tkinter
[Automatische Übersetzung] Tool zur Unterstützung der englischen Eingabe Translation-chan [Python]
Python-Anfänger Nr. 1 stellen einfache Tools zum Lernen von englischen Wörtern her
Teilen Sie Kamelfallzeichenfolgen in Python Wort für Wort
Python-Grammatikprüfung
Verfahren von der Umgebungskonstruktion bis zum Betriebstest von testinfra, einem von Python erstellten Testwerkzeug für die Serverumgebung