tesseract-OCR für Python [japanische Version]

tesseract-ocr for Python

Erstens, was Sie tun möchten

Ich möchte Japanisch mit OCR-Technologie extrahieren. Darüber hinaus wird das extrahierte Japanisch für verschiedene Zwecke verwendet.

Nutzungsumgebung

MacBook Pro (13-inch, Mid 2012) Prozessor: 2,5 GHz Intel Core i5 Speicher: 4 GB 1600 MHz DDR3 OS: OS X El Capitan (Ver.10.11.4)

Installationsreferenz:

You can install "Tesseract" using either "MacPorts"or"Homebrew". (Sie können "Tesseract" entweder mit "MacPorts" oder "Homebrew" installieren.)

1. Was ich benutzt habe

Terminal


sudo port install tesseract
# '<langcode>'Installieren Sie das Paket der Sprache, die Sie im Teil verarbeiten möchten(Englisch:eng,japanisch:jpn)
sudo port install tesseract-<langcode>

Terminal


brew install tesseract

2. Führen Sie aus

Dieses Mal habe ich ein Bild vorbereitet, das Japanisch und Englisch mischt.

Terminal


tesseract test.png out -l eng+jpn

Ergebnis

Ergebnis der Textausgabe


tesseract—ocr for Python

Einführung ヽ Was Sie tun möchten

Ich möchte Japanisch mit OCR-Technologie extrahieren.
Darüber hinaus wird das extrahierte Japanisch für verschiedene Zwecke verwendet.

Reflexionen

Ich habe es nicht im Detail ausprobiert, also ist es nicht so, Möglicherweise ändert sich das Ergebnis unter allen Bedingungen wie "Auflösung" und "Leerzeichen (einschließlich Ränder)". Wenn Sie es eines Tages brauchen, werde ich es überprüfen.

Übrigens sind "nur Englisch" und "nur Japanisch" recht gute Ergebnisse.

Recommended Posts

tesseract-OCR für Python [japanische Version]
2016-10-30 sonst für Python3> für:
Python [für mich]
PYTHON2.7 64-Bit-Version
Zusammenfassung der Kernel / Python-Version für jede Debian-Version
Über Python für Schleife
Python-Grundlagen ② für Anweisung
Über Python für ~ (Bereich)
Refactoring-Tools, die mit Python verwendet werden können
Toolchain für Python für Android
Japanische Ausgabe mit Python
Python Umweltfreundliche japanische Umgebung
OpenCV für Python-Anfänger
Überprüfen Sie die Version mit Python
Installieren Sie Python (für Windows)
[Python] für Anweisungsfehler
Wartung der Python-Umgebung für Projekte
Web Scraping für Anfänger in Python (1) Verbesserte Version
Ich habe pipenv und asdf für die Python-Versionskontrolle ausprobiert
Japanische Vorverarbeitung für maschinelles Lernen
Senden Sie japanische Post mit Python3
Ich habe Python auf Japanisch geschrieben
Fabric unterstützt Python 3
Python-Liste, für Anweisung, Wörterbuch
Python für die Datenanalyse Kapitel 4
Japanische OCR Memo Selbstversion
Lernablauf für Python-Anfänger
Python: Japanischer Text: Morphologische Analyse
BigQuery-Integration für Python-Benutzer
Python-Lernplan für KI-Lernen
Für Mac einrichten (Python)
Suche nach Breitenpriorität / bidirektionale Suche (Python Edition)
Installationsverfahren für Python und Ansible mit einer bestimmten Version
OpenCV3-Installation für Python3 @macOS
Persönliches Python-Code-Memo
Ändern Sie die Python-Version mit pyenv
Techniken zum Sortieren in Python
[Python] Japanische Methode zum Einstellen von Schriftarten für matplot lib 3.2 [Offizielle Konformität]
Upgrade von Python Anaconda
pp4 (Python Power für alles)
Python3-Umgebungskonstruktion (für Anfänger)
Japanisches NLP @ janome / spaCy / Python
Roadmap zum Veröffentlichen von Python-Paketen
Python-Version wechselt nicht
Python #Funktion 2 für Super-Anfänger
Python-Vorlage für Codeforces-manuelle Test-
Überprüfen Sie die OpenSSL-Version von Python 2.6
Japanische morphologische Analyse mit Python
#python python Vermeidung japanischer Syntaxfehler
Notizen für 3 Monate, seit ich Python gestartet habe
Qt für Python App Selbstaktualisierung
Einführung in Python (Python-Version APG4b)
[PyTorch] Tutorial (japanische Version) ① ~ Tensol ~
So ändern Sie die Python-Version
100 Pandas klopfen für Python-Anfänger
Checkios Empfehlung zum Erlernen von Python