[PYTHON] Transkription von Bildern mit der Vision API von GCP

Transkription von Bildern mit Vision API

'Typ': ist "TEXT_DETECTION" Es gibt zwei, "DOCUMENT_TEXT_DETECTION", und letztere ist ausgewählt.

#coding:utf-8
import base64
import json
from requests import Request, Session
from io import BytesIO
from PIL import Image
import pandas as pd

#Werfen Sie ein in PIL geöffnetes Bild in die Cloud Vision-API
def recognize_image(pil_image):
        def pil_image_to_base64(img_path):
            pil_image = Image.open(img_path)
            buffered = BytesIO()
            pil_image.save(buffered, format="PNG")
            str_encode_file = base64.b64encode(buffered.getvalue()).decode("utf-8")
            return str_encode_file
        
        def get_fullTextAnnotation(json_data):
            text_dict = json.loads(json_data)
            try:
                text = text_dict["responses"][0]["fullTextAnnotation"]["text"]
                return text
            except:
                print(None)
                return None

        str_encode_file = pil_image_to_base64(pil_image)###Hier am Ende löschen
        str_url = "https://vision.googleapis.com/v1/images:annotate?key="
        str_api_key = "API-Schlüssel"
        str_headers = {'Content-Type': 'application/json'}
        str_json_data = {
            'requests': [
                {
                    'image': {
                        'content': str_encode_file
                    },
                    'features': [
                        {
                            'type': "DOCUMENT_TEXT_DETECTION",
                            'maxResults': 10
                        }
                    ]
                }
            ]
        }

        obj_session = Session()
        obj_request = Request("POST",
                              str_url + str_api_key,
                              data=json.dumps(str_json_data),
                              headers=str_headers
                              )
        obj_prepped = obj_session.prepare_request(obj_request)
        obj_response = obj_session.send(obj_prepped,
                                        verify=True,
                                        timeout=60
                                        )

        if obj_response.status_code == 200:
            text = get_fullTextAnnotation(obj_response.text)
            
            return text

erkenne_image ("Bildpfad")

Recommended Posts

Transkription von Bildern mit der Vision API von GCP
Ablauf des Extrahierens von Text in PDF mit der Cloud Vision API
Multi-Class Multi-Label-Klassifizierung von Bildern mit Pytorch
Verwendung der Cloud Vision API von GCP
Erstellen Sie eine API für das Switchbot-Thermo-Hygrometer mit Node-RED
Mischen Sie Hunderttausende von Bildern gleichmäßig mit Tensorflow.
Probleme mit den Ausgabeergebnissen mit der Cloud Vision-API von Google
Textextraktion mit GCP Cloud Vision API (Python3.6)
Zeigen Sie Bilder in S3 mit API Gateway + Lambda an
Ich habe "License OCR" mit der Google Vision API ausprobiert
Kategorisieren Sie Gesichtsbilder von Anime-Charakteren mit Chainer
Automatische Sprachtranskription mit Google Cloud Speech API
Anonymer Upload von Bildern mit der Imgur-API (mit Python)
Ich habe "Receipt OCR" mit der Google Vision API ausprobiert
Wavelet-Konvertierung von Bildern mit PyWavelets und OpenCV
Erhalten Sie Datenbeschriftungen, indem Sie bei der Vorschau von Bildern mit Rails eine Verknüpfung mit der Google Cloud Vision-API herstellen
Jüngste Fähigkeit zur Bilderkennung - Die neuesten Forschungsergebnisse von MS unter Verwendung der Computer Vision API mit Python
Ich habe versucht, mit der Cloud Vision API von GCP automatisch erotische Bilder von Twitter zu sammeln
Zeigen Sie eingebettete Bilder von MP3 und Flac mit Mutagen an
Versuchen Sie, die Bildkonvertierung mit OpenCV mit Python zu projizieren
Erstellen Sie einen Stapel von Bildern und blasen Sie sie mit ImageDataGenerator auf
Ich habe versucht, das Bild mit Python + OpenCV "morphologisch zu konvertieren"
Textextraktion (Lese-API) mit Azure Computer Vision-API (Python3.6)
Laden Sie Videos mit der YouTube-API hoch
Sprachtranskriptionsverfahren mit der Google Cloud Speech API
Transkription von Bildern mit der Vision API von GCP
Identifizieren Sie den YouTube-Kanal des Hikakin-Videos anhand von Miniaturbildern mithilfe von CNN
So laden Sie YouTube-Videos mit pytube3 herunter
Sprachtranskriptionsverfahren mit Python und Google Cloud Speech API
Eine Geschichte über das Lesen eines Bilderbuchs durch Synthetisieren von Sprache mit COTOHA API und Cloud Vision API
Extrudieren Sie mit der Fusion360-API
Bild mit Python-Pptx zentrieren
Sammeln Sie eine große Anzahl von Bildern mit der Bildsuch-API von Bing
Bilderkennung mit API aus null Wissen mit AutoML Vision
Berühren wir die API der Netatmo Weather Station mit Python. #Python #Netatmo
Die Geschichte der Anzeige von Bildern mit OpenCV oder PIL (nur)
Erstellen Sie mit Falcon einen Light-Speed-Web-API-Server
Spracherkennung von WAV-Dateien mit der Google Cloud Speech API Beta
Erstellen Sie eine Web-API, die Bilder mit Django liefern kann