tesseract-OCR pour Python [version japonaise]

tesseract-ocr for Python

Tout d'abord, ce que tu veux faire

Je souhaite extraire le japonais en utilisant la technologie OCR. De plus, le japonais extrait sera utilisé à diverses fins.

Environnement d'utilisation

MacBook Pro (13-inch, Mid 2012) Processeur: Intel Core i5 2,5 GHz Mémoire: 4 Go DDR3 1600 MHz OS: OS X El Capitan (Ver.10.11.4)

Référence d'installation:

You can install "Tesseract" using either "MacPorts"or"Homebrew". (Vous pouvez installer "Tesseract" avec "MacPorts" ou "Homebrew".)

1. Ce que j'ai utilisé

Terminal


sudo port install tesseract
# '<langcode>'Installez le package de la langue que vous souhaitez traiter dans la pièce(Anglais:eng,Japonais:jpn)
sudo port install tesseract-<langcode>

Terminal


brew install tesseract

2. Exécutez

Cette fois, j'ai préparé une image qui mêle japonais et anglais.

Terminal


tesseract test.png out -l eng+jpn

résultat

Résultat de la sortie de texte


tesseract—ocr for Python

Introduction ヽ Ce que vous voulez faire

Je souhaite extraire le japonais en utilisant la technologie OCR.
De plus, le japonais extrait sera utilisé à diverses fins.

Réflexions

Je ne l'ai pas essayé en détail, donc ce n'est pas quelque chose comme ça, Peut-être que le résultat changera dans toutes les conditions telles que «résolution» et «espace vide (y compris les marges)». Si vous en avez besoin un jour, je le vérifierai.

Soit dit en passant, "anglais uniquement" et "japonais uniquement" sont de très bons résultats.

Recommended Posts

tesseract-OCR pour Python [version japonaise]
30/10/2016 else pour Python3> pour:
python [pour moi]
Version 64 bits de PYTHON2.7
Résumé des versions du noyau / Python pour chaque version de Debian
À propos de Python for loop
Bases de Python ② pour déclaration
À propos de Python, pour ~ (plage)
Refactoring des outils utilisables avec Python
Toolchain pour Python pour Android
Sortie japonaise avec Python
python Paramètre japonais respectueux de l'environnement
OpenCV pour les débutants en Python
Vérifier la version avec python
Installez Python (pour Windows)
[Python] pour une erreur d'instruction
Maintenance de l'environnement Python pour les projets
Web scraping pour les débutants en Python (1) Version améliorée
J'ai essayé pipenv et asdf pour le contrôle de version Python
Prétraitement japonais pour l'apprentissage automatique
Envoyer du courrier japonais avec Python3
J'ai écrit python en japonais
Prise en charge de Fabric pour Python 3
Liste Python, pour instruction, dictionnaire
Python pour l'analyse des données Chapitre 4
Version auto mémo OCR japonaise
Flux d'apprentissage pour les débutants en Python
Python: texte japonais: analyse morphologique
Intégration BigQuery pour les utilisateurs Python
Plan d'apprentissage Python pour l'apprentissage de l'IA
Configurer pour Mac (Python)
Recherche de priorité de largeur / recherche bidirectionnelle (édition Python)
Procédure d'installation pour Python et Ansible avec une version spécifique
Installation d'OpenCV3 pour Python3 @macOS
Mémo de code personnel Python
Balise xmp [Python] pour les photos
Changer la version de python à l'aide de pyenv
Techniques de tri en Python
[Python] Méthode de paramétrage des polices japonaises pour matplot lib 3.2 [Conformité officielle]
Mise à niveau de python Anaconda
pp4 (puissance python pour tout)
Construction de l'environnement Python3 (pour les débutants)
PNL japonais @ janome / spaCy / Python
Feuille de route pour la publication de packages Python
la version de python ne change pas
Python #function 2 pour les super débutants
Modèle Python pour Codeforces-test manuel-
Vérifiez la version OpenSSL de python 2.6
Analyse morphologique japonaise avec Python
#python python évitement des erreurs de syntaxe japonaise
Notes depuis 3 mois depuis que j'ai commencé Python
Mise à jour automatique de l'application Qt pour Python
Introduction à Python (version Python APG4b)
Tutoriel [PyTorch] (version japonaise) ① ~ Tensol ~
Comment changer la version de Python
Pandas 100 coups pour les débutants en Python
La recommandation de Checkio pour apprendre Python