Ich habe versucht, die Google Cloud Vision-API zu verwenden

Was ist Google Cloud Vision?

Google Cloud Vision ist ein Bildanalysedienst von Google. Dieses Mal habe ich damit den Text im Bild gelesen.

Schritt 1 Registrieren Sie sich bei Google Cloud Platform

Registrieren Sie sich über den unten stehenden Link für die Google Cloud Platform. Für die Registrierung ist eine Kreditkarte erforderlich. https://console.cloud.google.com/getting-started?hl=ja

Aktivieren Sie die Cloud Vision-API

Geben Sie "Cloud Vision API" in das Suchfenster oben auf dem Bildschirm ein. スクリーンショット 2020-10-02 17.34.47.png

Aktivieren Sie die Cloud Vision-API nach dem Übergang auf dem Bildschirm, und Sie sind fertig. スクリーンショット 2020-10-02 17.35.14.png

Erstellen eines Dienstkontos

Was ist ein Dienstkonto? Zitiert von hier → https://cloud.google.com/iam/docs/service-accounts?hl=ja

Ein Dienstkonto ist ein spezielles Konto, das von einer Instanz einer Anwendung oder einer virtuellen Maschine (VM) verwendet wird, nicht von einem Benutzer. Die Anwendung verwendet das Dienstkonto, um autorisierte API-Aufrufe durchzuführen.

Jetzt erstellen wir ein Dienstkonto. Klicken Sie unter "IAM and Management" auf das Dienstkonto. スクリーンショット 2020-10-02 17.57.26.png

Klicken Sie nach dem Übergang auf dem Bildschirm auf "Dienstkonto erstellen". スクリーンショット 2020-10-02 18.00.30.png

Geben Sie einen geeigneten Dienstkontonamen ein und klicken Sie auf "Erstellen". スクリーンショット 2020-10-02 18.02.16.png

Klicken Sie auf "Weiter". スクリーンショット 2020-10-02 18.08.46.png

Klicken Sie auf "Fertig stellen" スクリーンショット 2020-10-02 19.44.21.png

Als nächstes wird ein privater Schlüssel zur Authentifizierung erstellt. Nach dem Ausführen des obigen Vorgangs wird der folgende Bildschirm angezeigt. Klicken Sie daher auf "Vorgang", um einen Schlüssel zu erstellen. qVGSMdCDldLGqek1601635670_1601635725.png

Ein Dialogfeld wird angezeigt. Wählen Sie JSON aus und erstellen Sie einen Schlüssel. Platzieren Sie den Schlüssel in einem beliebigen Ordner und geben Sie den Schlüsselpfad in der Umgebungsvariablen (GOOGLE_APPLICATION_CREDENTIALS) an, die später beschrieben wird. ti0oDmp7fe6mIxY1601636143_1601636179.png

Installieren Sie gem.

gem 'google-cloud-vision'

Legen Sie den Pfad für den privaten Schlüssel in der Umgebungsvariablen fest und Sie können loslegen.

export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"

Implementierung

In Bezug auf die offizielle Dokumentation lautet dies wie folgt. · Offizielles Dokument https://cloud.google.com/vision/docs/libraries?hl=ja#client-libraries-usage-ruby

Der größte Unterschied zum offiziellen Beispiel besteht darin, dass text_detection anstelle von label_detection verwendet wird. Mit label_detection können Sie erkennen, was sich im Bild befindet. Wenn Sie beispielsweise das Innere eines Bahnhofs fotografieren, werden beispielsweise Fahrkartenschalter, Eisenbahnschienen und Fahrkartenautomaten erkannt. Dieses Mal habe ich text_detection verwendet, weil ich die Zeichen im Bild erkennen wollte.

@image = Image.new

require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator

#Geben Sie das zu lesende Bild an
file_name = "~/hoge.jpg "

# file_Analysieren Sie mit Cloud Vision mit dem Namen als Argument
response = image_annotator.text_detection image: file_name

response.responses.each do |res|
  @image.OCR = res.text_annotations[0].description
end

Zusammenfassung

Zusätzlich zu diesem Beispiel kann die Google Cloud Vision-API auch zum Analysieren von PDF-Dateien und zum Erkennen von Gesichtern in Bildern verwendet werden. Sie können bis zu 1000 Artikel pro Monat kostenlos laden. Probieren Sie also verschiedene Dinge aus und integrieren Sie sie in Ihre eigene App!

Recommended Posts

Ich habe versucht, die Google Cloud Vision-API zu verwenden
Ich habe die Google Cloud Vision-API zum ersten Mal ausprobiert
Ich habe versucht, die checkio-API zu verwenden
Ich habe versucht, die BigQuery-Speicher-API zu verwenden
Ich habe "License OCR" mit der Google Vision API ausprobiert
Ich habe "Receipt OCR" mit der Google Vision API ausprobiert
Ich habe versucht, Zeichen aus Untertiteln zu extrahieren (OpenCV: Google Cloud Vision API)
Bei der Einführung der Google Cloud Vision-API in Schienen habe ich die Dokumentation befolgt.
Ich habe versucht, die API von Sakenowa Data Project zu verwenden
Ich habe die Naro-Roman-API 2 ausprobiert
Als ich versuchte, die Computer Vision API von Microsoft zu verwenden, erkannte ich das Galapagos-Zeichen "Stop".
Ich habe die neuartige API von Naruro ausprobiert
Versuchen Sie, Lebensmittelfotos mithilfe der Google Cloud Vision-API zu beurteilen
[Python] Ich habe versucht, Daten mit der API von Wikipedia zu sammeln
Lassen Sie uns die Super Resolution API mithilfe der Google Cloud Platform veröffentlichen
[Für Anfänger] Ich habe versucht, die Tensorflow-Objekterkennungs-API zu verwenden
Ich habe versucht, mit der Cloud Vision API von GCP automatisch erotische Bilder von Twitter zu sammeln
Sprachtranskriptionsverfahren mit der Google Cloud Speech API
Verwenden Sie die Google Cloud Vision-API von Python
Ich habe versucht, die UnityCloudBuild-API von Python zu verwenden
Ich habe versucht, die COTOHA-API zu berühren
Bis Sie die Google Cloud Vision-API ausprobieren (Erkennung schädlicher Bilder)
Ich habe versucht, die COTOHA-API zu verwenden (es gibt auch Code auf GitHub).
Ich habe versucht, die Docomo-Spracherkennungs-API und die Google Speech-API in Java zu verwenden
Ich habe versucht, parametrisiert zu verwenden
Ich habe versucht, Argparse zu verwenden
Ich habe versucht, die Detect Labels-API von AWS Rekognition zu verwenden
Ich habe in der Bibliothek nach der Verwendung der Gracenote-API gesucht
Ich habe versucht, Mimesis zu verwenden
Ich habe versucht, Remote API mit GAE / J zu verwenden
Ich habe versucht, die Qiita-API von Anfang an zu aktivieren
Ich habe versucht, anytree zu verwenden
vprof - Ich habe versucht, den Profiler für Python zu verwenden
Ich habe versucht, aiomysql zu verwenden
Ich habe versucht, Summpy zu verwenden
Ich habe versucht, PyCaret mit der schnellsten Geschwindigkeit zu verwenden
Ich habe versucht, Coturn zu verwenden
Ich habe versucht, Pipenv zu verwenden
Ich habe versucht, Matplotlib zu verwenden
Ich habe versucht, "Anvil" zu verwenden.
Ich habe versucht, Hubot zu verwenden
Ich habe versucht, ESPCN zu verwenden
Verwendung der Google Cloud Translation API
Ich habe versucht, openpyxl zu verwenden
Ich habe versucht, verschiedene Sätze mit der automatischen Zusammenfassungs-API "summpy" zusammenzufassen.
Ich habe versucht, Ipython zu verwenden
Ich habe versucht, PyCaret zu verwenden
Ich habe versucht, Cron zu verwenden
Ich habe versucht, das Datetime-Modul von Python zu verwenden
Ich habe versucht, ngrok zu verwenden
Ich habe versucht, face_recognition zu verwenden
Ich habe versucht, Jupyter zu verwenden
Ich habe versucht, doctest zu verwenden
[GoogleCloudPlatform] Verwenden Sie die Google Cloud-API mit der API-Clientbibliothek
Ich habe versucht, den Bildfilter von OpenCV zu verwenden
Ich habe versucht, Folium zu verwenden