[PYTHON] Verwenden Sie pyOCR, um die Beschreibung auf der Karte in Text umzuwandeln

Zweck

Es ist ein Memorandum, wenn die Erklärung auf der Karte mit pyOCR in Text umgewandelt wird.

Vorbereitung

--Installieren Sie pyOCR, Tesseract, jpn.traineddata

Bilddaten mit pyOCR in Mac-Umgebung in Text konvertieren PyOCR-Installation

$ sudo pip install pyocr

>
 > Installieren Sie Tesseract, den OCR-Motorabschnitt
>
>```
$ brew install tesseract
$ ls /usr/local/Cellar/tesseract/4.1.0/share/tessdata/

Holen Sie sich jpn.traineddata

$ wget https://github.com/tesseract-ocr/tessdata/raw/4.00/jpn.traineddata $ mv jpn.traineddata /usr/local/Cellar/tesseract/4.1.0/share/tessdata/


 --Karte

 (Beispiel) Wir werden die folgenden Karten verwenden.
 Zitat: [Yugioh Duel Links erfassen](https://www.google.com/url?sa=i&url=https%3A%2F%2Fkamigame.jp%2F%25E9%2581%258A%25E6%2588%25AF%25E7 % 258E% 258B% 25E3% 2583% 2587% 25E3% 2583% 25A5% 25E3% 2582% 25A8% 25E3% 2583% 25AB% 25E3% 2583% 25AA% 25E3% 2583% 25B3% 25E3% 2582% 25AF% 25E3% 2582 % 25B9% 2F% 25E3% 2582% 25AB% 25E3% 2583% 25BC% 25E3% 2583% 2589% 2F% 25E9% 259D% 2592% 25E7% 259C% 25BC% 25E3% 2581% 25AE% 25E7% 2599% 25BD% 25E9 % 25BE% 258D.html & psig = AOvVaw3wIPO8FpnvpxrtFSCtCIN2 & ust = 1587370256244000 & source = images & cd = vfe & ved = 0CA0QjhxqFwoTCPiXxpiF9OgCFQAAAAAdAAAAABAD)
 ![card1.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/344880/8f50d346-efbd-5f03-0021-4e59f56d5df1.png)


# Code


#### **`sample.py`**
```py

from PIL import Image
import sys
sys.path.append('/path/to/dir')

import pyocr
import pyocr.builders

tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))

langs = tool.get_available_languages()
print("Available languages: %s" % ", ".join(langs))

txt = tool.image_to_string(
    Image.open('card.png'),
    lang='jpn',
    builder=pyocr.builders.TextBuilder()
)
print(txt)

Prüfung

$ python sample.py
Will use tool 'Tesseract (sh)'
Available languages: eng, jpn, jpn_vert, osd, snum
Ein eindringender E-Lagon, der sich eines erfolgreichen Angriffs rühmt. Was für Enkelkinder
Das Denkmal, die Zerstörung des Denkmals, ist unermesslich.

Bemerkungen

Wie kann es mit höherer Genauigkeit erkannt werden?

Codierungsfehler Maßnahmen

Problem: OCR-Ergebnis wird nicht ausgegeben Gegenmaßnahme: Die Zeichen im Bild sind möglicherweise zu klein, um analysiert zu werden. Ich konnte es analysieren, indem ich die Bildgröße vergrößerte. (Wenn eine andere erforderliche Vorverarbeitung erforderlich ist, sollte diese ausgeführt werden. Beispiel: Entfernen von Hintergrundgeräuschen)

Referenz

[Yugio Duel Links Strategy](https://www.google.com/url?sa=i&url=https%3A%2F%2Fkamigame.jp%2F%25E9%2581%258A%25E6%2588%25AF%25E7%258E % 258B% 25E3% 2583% 2587% 25E3% 2583% 25A5% 25E3% 2582% 25A8% 25E3% 2583% 25AB% 25E3% 2583% 25AA% 25E3% 2583% 25B3% 25E3% 2582% 25AF% 25E3% 2582% 25B9 % 2F% 25E3% 2582% 25AB% 25E3% 2583% 25BC% 25E3% 2583% 2589% 2F% 25E9% 259D% 2592% 25E7% 259C% 25BC% 25E3% 2581% 25AE% 25E7% 2599% 25BD% 25E9% 25BE % 258D.html & psig = AOvVaw3wIPO8FpnvpxrtFSCtCIN2 & ust = 1587370256244000 & source = images & cd = vfe & ved = 0CA0QjhxqFwoTCPiXxpiF9OgCFQAAAAAdAAAAABAD) Konvertieren von Bilddaten in Text mit pyOCR in einer Mac-Umgebung So führen Sie OCR in Python aus

Recommended Posts

Verwenden Sie pyOCR, um die Beschreibung auf der Karte in Text umzuwandeln
Konvertieren Sie XLSX in CSV in der Befehlszeile
Verwendung des Generators
Konvertieren Sie HTML in eine Textdatei
[Hyperledger Iroha] Hinweise zur Verwendung des Python SDK
Hinweise zur Verwendung von Marshmallow in der Schemabibliothek
Wie benutzt man den Dekorateur?
Konvertieren Sie nach dem Aufrufen der Shell-Datei unter Python CSV in Parkett.
Verwenden Sie Python auf Raspberry Pi 3, um die LED zu beleuchten (Hello World)
Google-Logo herunterladen → Text mit OCR → In HTML anzeigen
Verwendung von Jupyter am Frontend von Spacon ITO
Verwendung der Zip-Funktion
Verwendung des optparse-Moduls
Verwendung von Dataiku unter Windows
Konvertieren Sie wma in mp3 auf dem Mac
Hinweise zur Verwendung von Pywinauto
Hinweise zur Verwendung von featuretools
Wie benutzt man Homebrew in Debian?
Konvertierung von pdf nach txt 2 [pyocr]
Sakura Verwenden von Python im Internet
Verwendung des ConfigParser-Moduls
Verwenden Sie Python auf Raspberry Pi 3, um die LED mit Schaltersteuerung zu beleuchten!
Erzeugt halbautomatisch eine Beschreibung des Pakets, das in PyPI registriert werden soll
[C-Sprache] Verwendung der Krypta-Funktion unter Linux [Passwort-Hashing]
Verwendung der Spark ML-Pipeline
Verwenden Sie den Metabolic Disassembler in Google Colaboratory
Wie man Mecab, neologd-ipadic auf Colab verwendet
[Linux] Verwendung des Befehls echo
Ich möchte Linux auf dem Mac verwenden
Konvertieren Sie Rasterdaten mithilfe von Pandas in zeilenhaltige (?) Daten
So verwenden Sie Google Assistant unter Windows 10
Verwenden Sie numpys .flatten () [0], um den Wert abzurufen
Verwenden Sie den Grove-Sensor mit Raspberry Pi
Memorandum über die Verwendung von Gremlin Python
Konvertieren Sie an E-Mails angehängte PDF-Dateien in das Textformat
Installieren Sie Python auf xserver, um pip zu verwenden
Verwendung des IPython-Debuggers (ipdb)
Fügen Sie dem Bild Linien und Text hinzu
3 beste Möglichkeiten, den Befehl less zu verwenden
Ich möchte Python in der Umgebung von pyenv + pipenv unter Windows 10 verwenden
Skript zur ordnungsgemäßen Verwendung mehrerer Github-Konten im selben Repository auf demselben Computer
Ich habe versucht, Resultoon auf Mac + AVT-C875 zu verwenden, war aber unterwegs frustriert.
Verwenden Sie dHash, um eine Szene in einem Rennspiel auf der Strecke zu lokalisieren
Ich möchte horizontalen Text in vertikalen Text konvertieren und auf Twitter usw. veröffentlichen.