J'ai essayé d'utiliser l'API Google Cloud Vision

Qu'est-ce que Google Cloud Vision?

Google Cloud Vision est un service d'analyse d'images fourni par Google. Cette fois, je l'ai utilisé pour lire le texte de l'image.

Étape 1 Inscrivez-vous à Google Cloud Platform

Inscrivez-vous à Google Cloud Platform à partir du lien ci-dessous. Une carte de crédit est requise pour l'inscription. https://console.cloud.google.com/getting-started?hl=ja

Activer l'API Cloud Vision

Saisissez "Cloud Vision API" dans la fenêtre de recherche en haut de l'écran. スクリーンショット 2020-10-02 17.34.47.png

Activez l'API Cloud Vision à l'écran après la transition et vous avez terminé. スクリーンショット 2020-10-02 17.35.14.png

Créer un compte de service

Qu'est-ce qu'un compte de service? Cité d'ici → https://cloud.google.com/iam/docs/service-accounts?hl=ja

Un compte de service est un compte spécial utilisé par une application ou une instance de machine virtuelle (VM), et non par un utilisateur. L'application utilise le compte de service pour effectuer des appels API autorisés.

Créons maintenant un compte de service. Cliquez sur le compte de service dans "IAM et gestion". スクリーンショット 2020-10-02 17.57.26.png

Cliquez sur "Créer un compte de service" sur l'écran après la transition. スクリーンショット 2020-10-02 18.00.30.png

Entrez un nom de compte de service approprié et cliquez sur "Créer" スクリーンショット 2020-10-02 18.02.16.png

Cliquez sur "Continuer" スクリーンショット 2020-10-02 18.08.46.png

Cliquez sur "Terminer" スクリーンショット 2020-10-02 19.44.21.png

Vient ensuite la création d'une clé privée pour l'authentification. Après avoir effectué l'opération ci-dessus, je pense que l'écran ci-dessous est affiché, donc cliquez sur "Opération" pour créer une clé. qVGSMdCDldLGqek1601635670_1601635725.png

Une boîte de dialogue s'affiche. Sélectionnez JSON et créez une clé. Placez la clé dans n'importe quel dossier et spécifiez le chemin d'accès de la clé dans la variable d'environnement (GOOGLE_APPLICATION_CREDENTIALS) décrite plus loin. ti0oDmp7fe6mIxY1601636143_1601636179.png

Installez gem.

gem 'google-cloud-vision'

Définissez le chemin de la clé privée dans la variable d'environnement et vous êtes prêt à partir.

export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"

la mise en oeuvre

En référence à la documentation officielle, c'est comme suit. · Document officiel https://cloud.google.com/vision/docs/libraries?hl=ja#client-libraries-usage-ruby

La plus grande différence par rapport à l'exemple officiel est qu'il utilise text_detection au lieu de label_detection. Vous pouvez utiliser label_detection pour détecter le contenu de l'image. Par exemple, si vous prenez une photo de l'intérieur d'une gare, des éléments tels que les portillons, les voies ferrées et les distributeurs automatiques de billets seront détectés. Cette fois, j'ai utilisé text_detection parce que je voulais détecter les caractères de l'image.

@image = Image.new

require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator

#Spécifiez l'image à lire
file_name = "~/hoge.jpg "

# file_Analysez avec Cloud Vision avec le nom comme argument
response = image_annotator.text_detection image: file_name

response.responses.each do |res|
  @image.OCR = res.text_annotations[0].description
end

Sommaire

En plus de cet exemple, l'API Google Cloud Vision peut également être utilisée pour analyser des fichiers PDF et détecter des visages dans des images. Vous pouvez charger gratuitement jusqu'à 1000 articles par mois, alors essayons diverses choses et intégrons-les dans votre propre application!

Recommended Posts

J'ai essayé d'utiliser l'API Google Cloud Vision
J'ai essayé l'API Google Cloud Vision pour la première fois
J'ai essayé d'utiliser l'API checkio
J'ai essayé d'utiliser l'API BigQuery Storage
J'ai essayé "License OCR" avec l'API Google Vision
J'ai essayé "Receipt OCR" avec l'API Google Vision
J'ai essayé d'extraire des caractères des sous-titres (OpenCV: API Google Cloud Vision)
Lors de l'introduction de l'API Google Cloud Vision sur les rails, j'ai suivi la documentation.
J'ai essayé d'utiliser l'API de Sakenowa Data Project
J'ai essayé le roman Naro API 2
Lorsque j'ai essayé d'utiliser l'API Computer Vision de Microsoft, j'ai reconnu le signe Galapagos "Stop"
J'ai essayé l'API du roman Naruro
Essayez de juger des photos de plats à l'aide de l'API Google Cloud Vision
[Python] J'ai essayé de collecter des données en utilisant l'API de wikipedia
Publions l'API de super résolution à l'aide de Google Cloud Platform
[Pour les débutants] J'ai essayé d'utiliser l'API Tensorflow Object Detection
J'ai essayé de collecter automatiquement des images érotiques de Twitter à l'aide de l'API Cloud Vision de GCP
Procédure de transcription vocale à l'aide de l'API Google Cloud Speech
Utiliser l'API Google Cloud Vision de Python
J'ai essayé d'utiliser l'API UnityCloudBuild de Python
J'ai essayé de toucher l'API COTOHA
Jusqu'à ce que vous essayiez l'API Google Cloud Vision (détection d'images dangereuses)
J'ai essayé d'utiliser l'API COTOHA (il y a aussi du code sur GitHub)
J'ai essayé d'utiliser l'API de reconnaissance vocale docomo et l'API Google Speech en Java
J'ai essayé d'utiliser paramétré
J'ai essayé d'utiliser argparse
J'ai essayé d'utiliser l'API Detect Labels d'AWS Rekognition
J'ai recherché dans la bibliothèque l'utilisation de l'API Gracenote
J'ai essayé d'utiliser la mimesis
J'ai essayé d'utiliser l'API à distance avec GAE / J
J'ai essayé d'accéder à l'API Qiita depuis le début
J'ai essayé d'utiliser anytree
vprof - J'ai essayé d'utiliser le profileur pour Python
J'ai essayé d'utiliser aiomysql
J'ai essayé d'utiliser Summpy
J'ai essayé d'utiliser PyCaret à la vitesse la plus rapide
J'ai essayé d'utiliser coturn
J'ai essayé d'utiliser Pipenv
J'ai essayé d'utiliser matplotlib
J'ai essayé d'utiliser "Anvil".
J'ai essayé d'utiliser Hubot
J'ai essayé d'utiliser ESPCN
Comment utiliser l'API Google Cloud Translation
J'ai essayé d'utiliser openpyxl
J'ai essayé de résumer diverses phrases à l'aide de l'API de synthèse automatique "summpy"
J'ai essayé d'utiliser Ipython
J'ai essayé d'utiliser PyCaret
J'ai essayé d'utiliser cron
J'ai essayé d'utiliser le module Datetime de Python
J'ai essayé d'utiliser ngrok
J'ai essayé d'utiliser face_recognition
J'ai essayé d'utiliser Jupyter
J'ai essayé d'utiliser doctest
[GoogleCloudPlatform] Utiliser l'API Google Cloud avec la bibliothèque cliente d'API
J'ai essayé d'utiliser le filtre d'image d'OpenCV
J'ai essayé d'utiliser du folium