J'ai essayé d'utiliser l'API Google Cloud Vision

Qu'est-ce que Google Cloud Vision?

Google Cloud Vision est un service d'analyse d'images fourni par Google. Cette fois, je l'ai utilisé pour lire le texte de l'image.

Étape 1 Inscrivez-vous à Google Cloud Platform

Inscrivez-vous à Google Cloud Platform à partir du lien ci-dessous. Une carte de crédit est requise pour l'inscription. https://console.cloud.google.com/getting-started?hl=ja

Activer l'API Cloud Vision

Saisissez "Cloud Vision API" dans la fenêtre de recherche en haut de l'écran. スクリーンショット 2020-10-02 17.34.47.png

Activez l'API Cloud Vision à l'écran après la transition et vous avez terminé. スクリーンショット 2020-10-02 17.35.14.png

Créer un compte de service

Qu'est-ce qu'un compte de service? Cité d'ici → https://cloud.google.com/iam/docs/service-accounts?hl=ja

Un compte de service est un compte spécial utilisé par une application ou une instance de machine virtuelle (VM), et non par un utilisateur. L'application utilise le compte de service pour effectuer des appels API autorisés.

Créons maintenant un compte de service. Cliquez sur le compte de service dans "IAM et gestion". スクリーンショット 2020-10-02 17.57.26.png

Cliquez sur "Créer un compte de service" sur l'écran après la transition. スクリーンショット 2020-10-02 18.00.30.png

Entrez un nom de compte de service approprié et cliquez sur "Créer" スクリーンショット 2020-10-02 18.02.16.png

Cliquez sur "Continuer" スクリーンショット 2020-10-02 18.08.46.png

Cliquez sur "Terminer" スクリーンショット 2020-10-02 19.44.21.png

Vient ensuite la création d'une clé privée pour l'authentification. Après avoir effectué l'opération ci-dessus, je pense que l'écran ci-dessous est affiché, donc cliquez sur "Opération" pour créer une clé.

Une boîte de dialogue s'affiche. Sélectionnez JSON et créez une clé. Placez la clé dans n'importe quel dossier et spécifiez le chemin d'accès de la clé dans la variable d'environnement (GOOGLE_APPLICATION_CREDENTIALS) décrite plus loin.

Installez gem.

gem 'google-cloud-vision'

Définissez le chemin de la clé privée dans la variable d'environnement et vous êtes prêt à partir.

export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"

la mise en oeuvre

En référence à la documentation officielle, c'est comme suit. · Document officiel https://cloud.google.com/vision/docs/libraries?hl=ja#client-libraries-usage-ruby

La plus grande différence par rapport à l'exemple officiel est qu'il utilise text_detection au lieu de label_detection. Vous pouvez utiliser label_detection pour détecter le contenu de l'image. Par exemple, si vous prenez une photo de l'intérieur d'une gare, des éléments tels que les portillons, les voies ferrées et les distributeurs automatiques de billets seront détectés. Cette fois, j'ai utilisé text_detection parce que je voulais détecter les caractères de l'image.

@image = Image.new

require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator

#Spécifiez l'image à lire
file_name = "~/hoge.jpg "

# file_Analysez avec Cloud Vision avec le nom comme argument
response = image_annotator.text_detection image: file_name

response.responses.each do |res|
  @image.OCR = res.text_annotations[0].description
end

Sommaire

En plus de cet exemple, l'API Google Cloud Vision peut également être utilisée pour analyser des fichiers PDF et détecter des visages dans des images. Vous pouvez charger gratuitement jusqu'à 1000 articles par mois, alors essayons diverses choses et intégrons-les dans votre propre application!