[PYTHON] Utilisez pyOCR pour convertir la description de la carte en texte

Objectif

Il s'agit d'un mémorandum lors de la conversion de l'explication sur la carte en texte à l'aide de pyOCR.

Préparation

--Installez pyOCR, Tesseract, jpn.traineddata

Convertir les données d'image en texte avec pyOCR dans un environnement Mac Installation PyOCR

$ sudo pip install pyocr

>
 > Installer Tesseract, la section moteur OCR
>
>```
$ brew install tesseract
$ ls /usr/local/Cellar/tesseract/4.1.0/share/tessdata/

Obtenez jpn.traineddata

$ wget https://github.com/tesseract-ocr/tessdata/raw/4.00/jpn.traineddata $ mv jpn.traineddata /usr/local/Cellar/tesseract/4.1.0/share/tessdata/


 --Carte

 (Exemple) Nous utiliserons les cartes suivantes.
 Citation: [Capture Yugioh Duel Links](https://www.google.com/url?sa=i&url=https%3A%2F%2Fkamigame.jp%2F%25E9%2581%258A%25E6%2588%25AF%25E7 % 258E% 258B% 25E3% 2583% 2587% 25E3% 2583% 25A5% 25E3% 2582% 25A8% 25E3% 2583% 25AB% 25E3% 2583% 25AA% 25E3% 2583% 25B3% 25E3% 2582% 25AF% 25E3% 2582 % 25B9% 2F% 25E3% 2582% 25AB% 25E3% 2583% 25BC% 25E3% 2583% 2589% 2F% 25E9% 259D% 2592% 25E7% 259C% 25BC% 25E3% 2581% 25AE% 25E7% 2599% 25BD% 25E9 % 25BE% 258D.html & psig = AOvVaw3wIPO8FpnvpxrtFSCtCIN2 & ust = 1587370256244000 & source = images & cd = vfe & ved = 0CA0QjhxqFwoTCPiXxpiF9OgCFQAAAAAdAAAAABAD)
 ![card1.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/344880/8f50d346-efbd-5f03-0021-4e59f56d5df1.png)


# code


#### **`sample.py`**
```py

from PIL import Image
import sys
sys.path.append('/path/to/dir')

import pyocr
import pyocr.builders

tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))

langs = tool.get_available_languages()
print("Available languages: %s" % ", ".join(langs))

txt = tool.image_to_string(
    Image.open('card.png'),
    lang='jpn',
    builder=pyocr.builders.TextBuilder()
)
print(txt)

tester

$ python sample.py
Will use tool 'Tesseract (sh)'
Available languages: eng, jpn, jpn_vert, osd, snum
Un E-Lagon envahissant qui bénéficie d'une attaque prospère. Quel genre de petits-enfants
Le monument, la destruction du monument, est incommensurable.

Remarques

Comment le détecter avec une plus grande précision?

Mesures d'erreur de codage

problème: Le résultat OCR n'est pas sorti Contre-mesure: Les caractères de l'image sont peut-être trop petits pour être analysés. J'ai pu l'analyser en augmentant la taille de l'image. (Sinon, s'il y a un autre prétraitement nécessaire, il doit être exécuté. Exemple: Suppression du bruit de fond)

référence

[Stratégie Yugio Duel Links](https://www.google.com/url?sa=i&url=https%3A%2F%2Fkamigame.jp%2F%25E9%2581%258A%25E6%2588%25AF%25E7%258E % 258B% 25E3% 2583% 2587% 25E3% 2583% 25A5% 25E3% 2582% 25A8% 25E3% 2583% 25AB% 25E3% 2583% 25AA% 25E3% 2583% 25B3% 25E3% 2582% 25AF% 25E3% 2582% 25B9 % 2F% 25E3% 2582% 25AB% 25E3% 2583% 25BC% 25E3% 2583% 2589% 2F% 25E9% 259D% 2592% 25E7% 259C% 25BC% 25E3% 2581% 25AE% 25E7% 2599% 25BD% 25E9% 25BE % 258D.html & psig = AOvVaw3wIPO8FpnvpxrtFSCtCIN2 & ust = 1587370256244000 & source = images & cd = vfe & ved = 0CA0QjhxqFwoTCPiXxpiF9OgCFQAAAAAdAAAAABAD) Convertir les données d'image en texte avec pyOCR dans un environnement Mac Comment exécuter l'OCR en Python

Recommended Posts

Utilisez pyOCR pour convertir la description de la carte en texte
Convertir XLSX en CSV sur la ligne de commande
Comment utiliser le générateur
Convertir le HTML en fichier texte
[Hyperledger Iroha] Remarques sur l'utilisation du SDK Python
Remarques sur l'utilisation de la guimauve dans la bibliothèque de schémas
Comment utiliser le décorateur
Après avoir appelé le fichier Shell sur Python, convertissez CSV en Parquet.
Utilisez python sur Raspberry Pi 3 pour éclairer la LED (Hello World)
Télécharger le logo Google → Texte avec OCR → Affichage sur HTML
Comment utiliser Jupyter sur le frontal de Spacon ITO
Comment utiliser la fonction zip
Comment utiliser le module optparse
Comment utiliser Dataiku sous Windows
Convertir WMA en MP3 sur Mac
Remarques sur l'utilisation de pywinauto
Remarques sur l'utilisation des featuretools
Comment utiliser l'homebrew dans Debian
Conversion de pdf en txt 2 [pyocr]
Sakura utilisant Python sur Internet
Comment utiliser le module ConfigParser
Utilisez python sur Raspberry Pi 3 pour éclairer la LED avec le contrôle du commutateur!
Générer semi-automatiquement une description du package à enregistrer dans PyPI
[Langage C] Comment utiliser la fonction crypt sous Linux [Hachage de mot de passe]
Comment utiliser le pipeline Spark ML
Utilisez le désassembleur métabolique sur Google Colaboratory
Comment utiliser mecab, neologd-ipadic sur colab
[Linux] Comment utiliser la commande echo
Je veux utiliser Linux sur mac
Convertir les données de la grille en données contenant des lignes (?) À l'aide de pandas
Comment utiliser l'Assistant Google sur Windows 10
Utilisez .flatten () [0] de numpy pour récupérer la valeur
Utiliser le capteur Grove avec Raspberry Pi
Mémorandum sur l'utilisation du python gremlin
Convertir un PDF joint en courrier électronique au format texte
Installez python sur xserver pour utiliser pip
Comment utiliser le débogueur IPython (ipdb)
Ajouter des lignes et du texte sur l'image
3 meilleures façons d'utiliser la commande less
Je souhaite utiliser Python dans l'environnement de pyenv + pipenv sous Windows 10
Script pour utiliser correctement plusieurs comptes github dans le même référentiel sur la même machine
J'ai essayé d'utiliser Resultoon sur Mac + AVT-C875, mais j'étais frustré en chemin.
Utilisez dHash pour localiser sur le parcours à partir d'une scène dans un jeu de course
Je souhaite convertir du texte horizontal en texte vertical et le publier sur Twitter, etc.