Lire des caractères dans des images avec Python OCR

Installation de tesseract

$ brew install tesseract

Installez la bibliothèque qui exécute tessetac

$ pip3 install pyocr

Paramètres de lecture japonais

$ curl -L -o /usr/local/share/tessdata/jpn.traineddata 'https://github.com/tesseract-ocr/tessdata/raw/master/jpn.traineddata'
$ tesseract --list-langs

List of available languages (4):
eng
jpn
osd
snum

Implémentation OCR

from PIL import Image
import sys
import pyocr
import pyocr.builders

tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
# The tools are returned in the recommended order of usage
tool = tools[0]

txt = tool.image_to_string(
    Image.open('{path}'),
    lang="jpn",
    builder=pyocr.builders.TextBuilder(tesseract_layout=6)
)
print(txt)

Recommended Posts

Lire des caractères dans des images avec Python OCR
Reconnaissance des nombres dans les images avec Python
GOTO en Python avec Sublime Text 3
Extraire du texte d'images avec Python
Lire des fichiers en parallèle avec Python
Travailler avec des images DICOM en Python
[Python] Lire des images avec OpenCV (pour les débutants)
Texte de cluster en Python
Lire DXF avec python
Traitement de texte avec Python
Convertissez des PDF en images en masse avec Python
Lire les données de la table dans un fichier PDF avec Python
Traitement de texte UTF8 avec python
Lire csv avec des pandas python
Images en bordure avec python Partie 1
Encodage base64 des images en Python 3
Grattage au sélénium en Python
Exploitez LibreOffice avec Python
Débogage avec pdb en Python
[Python] Obtenez les nombres dans l'image graphique avec OCR
OCR à partir de PDF en Python
Lire la formule d'Euler en Python
Gérer les sons en Python
Grattage avec Tor en Python
Lire du XML avec un espace de noms spécifié en Python
Tweet avec image en Python
Combiné avec ordinal en Python
Lire la sortie Fortran avec python
Extraction de texte (API de lecture) avec l'API Azure Computer Vision (Python3.6)
Lire des données json avec python
J'ai essayé de [gratter] des images de mode et des phrases de texte avec Python.
[Internal_math (1)] Lire avec la bibliothèque AtCoder Green Coder ~ Implémentation en Python ~
Manipulation des pixels d'image en Python
Tester avec des nombres aléatoires en Python
Travailler avec LibreOffice en Python: import
Scraping avec Selenium en Python (Basic)
Comment collecter des images en Python
Analyse CSS avec cssutils en Python
Extraction de texte avec AWS Textract (Python3.6)
Numer0n avec des objets fabriqués avec Python
Lire des morceaux PNG en Python (édition de classe)
Générer des images de texte multilingues à l'aide de Python
Text mining avec Python ① Analyse morphologique
Activer Python raw_input avec Sublime Text 3
Utiliser rospy avec virtualenv dans Python3
Publiez plusieurs images Twitter avec python
Trier les gros fichiers texte en Python
Animez plusieurs images fixes avec Python
Utiliser Python mis en pyenv avec NeoVim
Charger une image gif avec Python + OpenCV
Heatmap avec dendrogramme en Python + matplotlib
Parlez du texte japonais avec OpenJTalk + python
Générer un mot de passe pour le manuel avec python
Utiliser OpenCV avec Python 3 dans Window
Jusqu'à traiter de python dans Atom
Lire et écrire du texte en Python
Charger fbx depuis python avec cinema4d
Démarrez avec Python avec Blender
Créer et lire des paquets de messages en Python