Google Cloud Vision est un service d'analyse d'images fourni par Google. Cette fois, je l'ai utilisé pour lire le texte de l'image.
Inscrivez-vous à Google Cloud Platform à partir du lien ci-dessous. Une carte de crédit est requise pour l'inscription. https://console.cloud.google.com/getting-started?hl=ja
Saisissez "Cloud Vision API" dans la fenêtre de recherche en haut de l'écran.
Activez l'API Cloud Vision à l'écran après la transition et vous avez terminé.
Qu'est-ce qu'un compte de service? Cité d'ici → https://cloud.google.com/iam/docs/service-accounts?hl=ja
Un compte de service est un compte spécial utilisé par une application ou une instance de machine virtuelle (VM), et non par un utilisateur. L'application utilise le compte de service pour effectuer des appels API autorisés.
Créons maintenant un compte de service. Cliquez sur le compte de service dans "IAM et gestion".
Cliquez sur "Créer un compte de service" sur l'écran après la transition.
Entrez un nom de compte de service approprié et cliquez sur "Créer"
Cliquez sur "Continuer"
Cliquez sur "Terminer"
Vient ensuite la création d'une clé privée pour l'authentification. Après avoir effectué l'opération ci-dessus, je pense que l'écran ci-dessous est affiché, donc cliquez sur "Opération" pour créer une clé.
Une boîte de dialogue s'affiche. Sélectionnez JSON et créez une clé. Placez la clé dans n'importe quel dossier et spécifiez le chemin d'accès de la clé dans la variable d'environnement (GOOGLE_APPLICATION_CREDENTIALS) décrite plus loin.
Installez gem.
gem 'google-cloud-vision'
Définissez le chemin de la clé privée dans la variable d'environnement et vous êtes prêt à partir.
export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"
En référence à la documentation officielle, c'est comme suit. · Document officiel https://cloud.google.com/vision/docs/libraries?hl=ja#client-libraries-usage-ruby
La plus grande différence par rapport à l'exemple officiel est qu'il utilise text_detection au lieu de label_detection. Vous pouvez utiliser label_detection pour détecter le contenu de l'image. Par exemple, si vous prenez une photo de l'intérieur d'une gare, des éléments tels que les portillons, les voies ferrées et les distributeurs automatiques de billets seront détectés. Cette fois, j'ai utilisé text_detection parce que je voulais détecter les caractères de l'image.
@image = Image.new
require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator
#Spécifiez l'image à lire
file_name = "~/hoge.jpg "
# file_Analysez avec Cloud Vision avec le nom comme argument
response = image_annotator.text_detection image: file_name
response.responses.each do |res|
@image.OCR = res.text_annotations[0].description
end
En plus de cet exemple, l'API Google Cloud Vision peut également être utilisée pour analyser des fichiers PDF et détecter des visages dans des images. Vous pouvez charger gratuitement jusqu'à 1000 articles par mois, alors essayons diverses choses et intégrons-les dans votre propre application!
Recommended Posts