Dieser Artikel beschreibt die Verwendung der Vision-API von GCP durch Überspringen schwieriger Aufgaben. Sie können es bereits zum ersten Mal verwenden, wenn Sie dem Bild folgen.
Google Vision API https://cloud.google.com/vision/docs/ocr/?hl=ja (Ich konnte auf die Installation des Google Cloud SDK verzichten. Dank der Installation von Google Cloud Vision mit Pip?)
Windows10 Python 3.7 installieren Erstellen eines GCP-Kontos Vorbereiten des Bildes, das Sie lesen möchten
Rufen Sie zunächst die Google Vision-API-Bibliothek ab. Geben Sie den folgenden Befehl ein.
pip install --upgrade google-cloud-vision
Nach der Installation werden wir es testen. Öffnen Sie Python
from google.cloud import vision
Ausführen. Wenn dies keinen Fehler verursacht, ist es in Ordnung. Wenn nicht
Python 3.7.7 (default, May 6 2020, 11:45:54) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32 Type "help", "copyright", "credits" or "license" for more information. >>> from google.cloud import vision Traceback (most recent call last): File "
", line 1, in ImportError: cannot import name 'vision' from 'google.cloud' (unknown location)
Es wird angezeigt.
Dieses Mal werden wir ein neues GCP-Projekt einrichten. Klicken Sie auf Neues Projekt. Erstellen Sie einen Projektnamen mit einem beschreibenden Namen.
Aktivieren Sie nach dem Erstellen des Projekts die Vision-API. Bitte klicken Sie in der Reihenfolge der Bildnummern.
Geben Sie "Google Vision API" in das Suchfenster ein. Klicken Sie auf das angezeigte Element. Klicken Sie auf die Schaltfläche Aktivieren.
Wählen Sie entsprechend der Nummer im Bild. Geben Sie einen geeigneten Dienstkontonamen ein. Die ID wird automatisch eingegeben, sodass Sie sie unverändert lassen können. Bitte wählen Sie eine geeignete Rolle. Der nächste Bildschirm wird so wie er ist abgeschlossen. Ein Dienstkonto wurde hinzugefügt. Klicken Sie auf image.png. Und wählen Sie "Schlüssel erstellen". Wählen Sie JSON und klicken Sie auf Fertig stellen. Verschieben Sie die heruntergeladene Datei an einen beliebigen Speicherort.
Legen Sie die Umgebungsvariablen fest. Variablen: GOOGLE_APPLICATION_CREDENTIALS Wert: Speicherort und Name der heruntergeladenen JSON-Datei (Beispiel: c: \ user \ xxxxxx \ desctop \ xxxxxxx.json)
Das Einstellverfahren ist wie folgt. Fahren Sie gemäß den Zahlen im Bild fort.
Ändern Sie den von Github mitgebrachten Quellcode.
detext.py
"""Detects text in the file."""
from google.cloud import vision
import io
client = vision.ImageAnnotatorClient()
# [START vision_python_migration_text_detection]
path = "C:\\Users\\xxxx\\Desktop\\gcptest\\xxxxx.png "
with io.open(path, 'rb') as image_file:
content = image_file.read()
image = vision.types.Image(content=content)
response = client.text_detection(image=image)
texts = response.text_annotations
print('Texts:')
for text in texts:
print('\n"{}"'.format(text.description))
vertices = (['({},{})'.format(vertex.x, vertex.y)
for vertex in text.bounding_poly.vertices])
print('bounds: {}'.format(','.join(vertices)))
if response.error.message:
raise Exception(
'{}\nFor more info on error messages, check: '
'https://cloud.google.com/apis/design/errors'.format(
response.error.message))
Sie können das Bild ändern, indem Sie den Teil von "path =" C: \ Benutzer \ xxxx \ Desktop \ gcptest \ xxxxx.png "" in der 7. Zeile des Quellcodes ändern. Das folgende Bild dient als Beispiel.
Ausgabeergebnis
"Gib dein Bestes Japan Meiji Choco Snack Berg der Pilze Duftender Erdbeergeschmack nur TOKTO 0 20 ES Kind) ©Tokyo 2020 " bounds: (1,66),(745,66),(745,954),(1,954) "Kanbare" bounds: (72,80),(351,73),(353,152),(74,159) "Nippon" bounds: (353,73),(619,66),(621,145),(355,152) "Meiji" bounds: (208,151),(305,150),(305,190),(208,191) "Schokolade" bounds: (307,151),(405,150),(405,189),(307,190) "Snack" bounds: (394,156),(535,155),(535,184),(394,185) "Pilz" bounds: (33,167),(471,157),(475,354),(37,364) "von" bounds: (473,157),(569,155),(573,352),(477,354) "Berg" bounds: (571,155),(735,151),(739,348),(575,352) "Kaoru" bounds: (131,403),(314,390),(322,502),(139,516) "Erdbeere" bounds: (315,390),(596,370),(604,482),(323,503) "Geschmack" bounds: (598,370),(671,365),(679,476),(606,482) "nur" bounds: (637,551),(736,527),(745,564),(646,588) "TOKTO" bounds: (236,697),(260,690),(263,701),(239,708) "0" bounds: (262,691),(277,687),(280,696),(265,701) "20" bounds: (1,804),(34,804),(34,829),(1,829) "ES" bounds: (1,828),(16,828),(16,844),(1,844) "Kind" bounds: (1,910),(18,910),(18,932),(1,932) ")" bounds: (19,912),(24,912),(24,927),(19,927) "©Tokyo" bounds: (72,924),(150,921),(151,951),(73,954) "2020" bounds: (157,921),(210,919),(211,949),(158,951)
Wie erwartet
Recommended Posts