tesseract-ocr for Python
Ich möchte Japanisch mit OCR-Technologie extrahieren. Darüber hinaus wird das extrahierte Japanisch für verschiedene Zwecke verwendet.
MacBook Pro (13-inch, Mid 2012) Prozessor: 2,5 GHz Intel Core i5 Speicher: 4 GB 1600 MHz DDR3 OS: OS X El Capitan (Ver.10.11.4)
You can install "Tesseract" using either "MacPorts"or"Homebrew". (Sie können "Tesseract" entweder mit "MacPorts" oder "Homebrew" installieren.)
Terminal
sudo port install tesseract
# '<langcode>'Installieren Sie das Paket der Sprache, die Sie im Teil verarbeiten möchten(Englisch:eng,japanisch:jpn)
sudo port install tesseract-<langcode>
Terminal
brew install tesseract
Dieses Mal habe ich ein Bild vorbereitet, das Japanisch und Englisch mischt.
Terminal
tesseract test.png out -l eng+jpn
Ergebnis der Textausgabe
tesseract—ocr for Python
Einführung ヽ Was Sie tun möchten
Ich möchte Japanisch mit OCR-Technologie extrahieren.
Darüber hinaus wird das extrahierte Japanisch für verschiedene Zwecke verwendet.
Ich habe es nicht im Detail ausprobiert, also ist es nicht so, Möglicherweise ändert sich das Ergebnis unter allen Bedingungen wie "Auflösung" und "Leerzeichen (einschließlich Ränder)". Wenn Sie es eines Tages brauchen, werde ich es überprüfen.
Übrigens sind "nur Englisch" und "nur Japanisch" recht gute Ergebnisse.
Recommended Posts