[PYTHON] Transcription d'images avec l'API Vision de GCP

Transcription d'images avec l'API Vision

'type': est "TEXT_DETECTION" Il y en a deux, "DOCUMENT_TEXT_DETECTION", et ce dernier est sélectionné.

#coding:utf-8
import base64
import json
from requests import Request, Session
from io import BytesIO
from PIL import Image
import pandas as pd

#Lancer une image ouverte dans PIL vers l'API Cloud Vision
def recognize_image(pil_image):
        def pil_image_to_base64(img_path):
            pil_image = Image.open(img_path)
            buffered = BytesIO()
            pil_image.save(buffered, format="PNG")
            str_encode_file = base64.b64encode(buffered.getvalue()).decode("utf-8")
            return str_encode_file
        
        def get_fullTextAnnotation(json_data):
            text_dict = json.loads(json_data)
            try:
                text = text_dict["responses"][0]["fullTextAnnotation"]["text"]
                return text
            except:
                print(None)
                return None

        str_encode_file = pil_image_to_base64(pil_image)###Effacez ici à la fin
        str_url = "https://vision.googleapis.com/v1/images:annotate?key="
        str_api_key = "Clé API"
        str_headers = {'Content-Type': 'application/json'}
        str_json_data = {
            'requests': [
                {
                    'image': {
                        'content': str_encode_file
                    },
                    'features': [
                        {
                            'type': "DOCUMENT_TEXT_DETECTION",
                            'maxResults': 10
                        }
                    ]
                }
            ]
        }

        obj_session = Session()
        obj_request = Request("POST",
                              str_url + str_api_key,
                              data=json.dumps(str_json_data),
                              headers=str_headers
                              )
        obj_prepped = obj_session.prepare_request(obj_request)
        obj_response = obj_session.send(obj_prepped,
                                        verify=True,
                                        timeout=60
                                        )

        if obj_response.status_code == 200:
            text = get_fullTextAnnotation(obj_response.text)
            
            return text

Recogn_image ("chemin de l'image")

Recommended Posts

Transcription d'images avec l'API Vision de GCP
Flux d'extraction de texte au format PDF avec l'API Cloud Vision
Classification multi-étiquette d'images multi-classes avec pytorch
Comment utiliser l'API Cloud Vision de GCP
Créer une API pour le thermo-hygromètre Switchbot avec Node-RED
Mélangez des centaines de milliers d'images uniformément avec tensorflow.
Problèmes avec les résultats de sortie avec l'API Cloud Vision de Google
Extraction de texte avec l'API GCP Cloud Vision (Python3.6)
Afficher les images sur S3 avec API Gateway + Lambda
J'ai essayé "License OCR" avec l'API Google Vision
Catégoriser les images de visage de personnages d'anime avec Chainer
Transcription vocale automatique avec l'API Google Cloud Speech
Téléchargement anonyme d'images à l'aide de l'API Imgur (à l'aide de Python)
J'ai essayé "Receipt OCR" avec l'API Google Vision
Conversion en ondelettes d'images avec PyWavelets et OpenCV
Obtenez des étiquettes de données en les associant à l'API Google Cloud Vision lors de la prévisualisation d'images avec Rails
Capacité récente de reconnaissance d'image - Résultats de recherche de pointe de MS à l'aide de l'API de vision par ordinateur avec Python
J'ai essayé de collecter automatiquement des images érotiques de Twitter à l'aide de l'API Cloud Vision de GCP
Afficher des images intégrées de mp3 et flac avec mutagène
Essayez de projeter la conversion d'image en utilisant OpenCV avec Python
Créez un lot d'images et gonflez avec ImageDataGenerator
J'ai essayé la "conversion de morphologie" de l'image avec Python + OpenCV
Extraction de texte (API de lecture) avec l'API Azure Computer Vision (Python3.6)
Mettre en ligne des vidéos à l'aide de l'API YouTube
Procédure de transcription vocale à l'aide de l'API Google Cloud Speech
Transcription d'images avec l'API Vision de GCP
Identifiez la chaîne YouTube de la vidéo Hikakin à partir d'images miniatures à l'aide de CNN
Comment télécharger des vidéos YouTube à l'aide de pytube3
Procédure de transcription vocale à l'aide de Python et de l'API Google Cloud Speech
Une histoire de lecture d'un livre d'images en synthétisant la voix avec l'API COTOHA et l'API Cloud Vision
Extruder avec l'API Fusion360
Centrer l'image avec python-pptx
Collectez un grand nombre d'images à l'aide de l'API de recherche d'images de Bing
Reconnaissance d'image avec API à partir de zéro connaissance avec AutoML Vision
Touchons l'API de Netatmo Weather Station avec Python. #Python #Netatmo
L'histoire de l'affichage d'images avec OpenCV ou PIL (uniquement)
Créez un serveur API Web ultra-rapide avec Falcon
Reconnaissance vocale des fichiers wav avec Google Cloud Speech API Beta
Créez une API Web capable de fournir des images avec Django