Google Cloud Vision ist ein Bildanalysedienst von Google. Dieses Mal habe ich damit den Text im Bild gelesen.
Registrieren Sie sich über den unten stehenden Link für die Google Cloud Platform. Für die Registrierung ist eine Kreditkarte erforderlich. https://console.cloud.google.com/getting-started?hl=ja
Geben Sie "Cloud Vision API" in das Suchfenster oben auf dem Bildschirm ein.
Aktivieren Sie die Cloud Vision-API nach dem Übergang auf dem Bildschirm, und Sie sind fertig.
Was ist ein Dienstkonto? Zitiert von hier → https://cloud.google.com/iam/docs/service-accounts?hl=ja
Ein Dienstkonto ist ein spezielles Konto, das von einer Instanz einer Anwendung oder einer virtuellen Maschine (VM) verwendet wird, nicht von einem Benutzer. Die Anwendung verwendet das Dienstkonto, um autorisierte API-Aufrufe durchzuführen.
Jetzt erstellen wir ein Dienstkonto. Klicken Sie unter "IAM and Management" auf das Dienstkonto.
Klicken Sie nach dem Übergang auf dem Bildschirm auf "Dienstkonto erstellen".
Geben Sie einen geeigneten Dienstkontonamen ein und klicken Sie auf "Erstellen".
Klicken Sie auf "Weiter".
Klicken Sie auf "Fertig stellen"
Als nächstes wird ein privater Schlüssel zur Authentifizierung erstellt. Nach dem Ausführen des obigen Vorgangs wird der folgende Bildschirm angezeigt. Klicken Sie daher auf "Vorgang", um einen Schlüssel zu erstellen.
Ein Dialogfeld wird angezeigt. Wählen Sie JSON aus und erstellen Sie einen Schlüssel. Platzieren Sie den Schlüssel in einem beliebigen Ordner und geben Sie den Schlüsselpfad in der Umgebungsvariablen (GOOGLE_APPLICATION_CREDENTIALS) an, die später beschrieben wird.
Installieren Sie gem.
gem 'google-cloud-vision'
Legen Sie den Pfad für den privaten Schlüssel in der Umgebungsvariablen fest und Sie können loslegen.
export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"
In Bezug auf die offizielle Dokumentation lautet dies wie folgt. · Offizielles Dokument https://cloud.google.com/vision/docs/libraries?hl=ja#client-libraries-usage-ruby
Der größte Unterschied zum offiziellen Beispiel besteht darin, dass text_detection anstelle von label_detection verwendet wird. Mit label_detection können Sie erkennen, was sich im Bild befindet. Wenn Sie beispielsweise das Innere eines Bahnhofs fotografieren, werden beispielsweise Fahrkartenschalter, Eisenbahnschienen und Fahrkartenautomaten erkannt. Dieses Mal habe ich text_detection verwendet, weil ich die Zeichen im Bild erkennen wollte.
@image = Image.new
require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator
#Geben Sie das zu lesende Bild an
file_name = "~/hoge.jpg "
# file_Analysieren Sie mit Cloud Vision mit dem Namen als Argument
response = image_annotator.text_detection image: file_name
response.responses.each do |res|
@image.OCR = res.text_annotations[0].description
end
Zusätzlich zu diesem Beispiel kann die Google Cloud Vision-API auch zum Analysieren von PDF-Dateien und zum Erkennen von Gesichtern in Bildern verwendet werden. Sie können bis zu 1000 Artikel pro Monat kostenlos laden. Probieren Sie also verschiedene Dinge aus und integrieren Sie sie in Ihre eigene App!
Recommended Posts