Streamen Sie die Spracherkennung mithilfe der gRPC-API von Google Cloud Speech mit Python3 auf dem Mac!

Vorherige Erklärung

Neueste Informationen (7. November 2017)

Es scheint, dass die Google API-Oberfläche geändert wurde und nicht so funktioniert, wie sie ist. Wenn Sie die Spracherkennung für Streams in Zukunft noch nicht kennen, lesen Sie bitte den folgenden Artikel von @delete. https://qiita.com/delete/items/395776c6843d67fd65fd

Artikel, die ich früher geschrieben habe

Es ist unten.

Ich möchte eine Stream-Spracherkennung mit der Google Cloud Speech gRPC-API durchführen! (Mit einem einfachen VAD)] http://qiita.com/sayonari/items/a70118a468483967ad34

Erläuterung dieses Artikels

In diesem Artikel habe ich die Google-Spracherkennung in einer neuen Umgebung durchgeführt, aber sie hat nicht funktioniert. Daher werde ich eine Notiz hinterlassen, wann ich sie von Anfang an installiert habe. Wir konnten es nicht ordnungsgemäß erneut überprüfen. Wenn Sie also Meinungen oder Korrekturen finden, zögern Sie bitte nicht, uns Ihre Meinung mitzuteilen.

Hauptgeschichte

Ausführungsumgebung

Installation

google cloud API dashboard https://console.cloud.google.com/?hl=ja Die Methode, die Sprach-API mit der Google Cloud-API verfügbar zu machen, ist ziemlich ärgerlich, aber sie enthält viele Informationen. Bitte googeln Sie sie selbst.

Ein Projekt erstellen

Erstellen Sie ein Projekt mit Ihrem Lieblingsnamen. Ich habe ein Projekt namens "GoogleCloudAPI-ASRtest" gemacht. Wenn Sie SpeechAPI verwenden können, wird die ID in der API angezeigt. Denken Sie also daran.

Bibliotheksinstallation

pip install google.cloud.speech

Installieren Sie den Befehl gcloud

https://cloud.google.com/sdk/docs/quickstart-mac-os-x?hl=ja

Führen Sie install.sh aus

SDK-Initialisierung

gcloud init

Sie werden gefragt "Sie müssen sich anmelden, um fortzufahren. Möchten Sie sich anmelden (J / N)?". Geben Sie also Y ein.

Der Browser wird gestartet. Melden Sie sich daher mit dem bei der API registrierten Google-Konto an.

Unter "Zu verwendendes Cloud-Projekt auswählen:" wird der Name des API-Projekts zusammen mit der Nummer aufgeführt. Wählen Sie daher das Projekt aus, in dem SpeechAPI registriert ist.

「Do you want to configure Google Compute Engine (https://cloud.google.com/compute) Einstellungen (J / N)? ”Wählen Sie den Server als Y aus. Es wurde in "[2] asien-east1-b" geändert.

Fügen Sie den Pfad zu PYTHONPATH hinzu

pip install gcloud

Fügen Sie das installierte Verzeichnis zu PYTHONPATH hinzu

In meinem Fall war es wie folgt. export PYTHONPATH="/Users/nishimura/.pyenv/versions/3.6.1/lib/python3.6/site-packages:$PYTHONPATH"

Wenn Sie dies zu ~ / .bash_profile hinzufügen, wird es jedes Mal automatisch ausgeführt, was praktisch ist.

Standardeinstellungen für Anmeldeinformationen

gcloud auth application-default login

Der Browser wird gestartet. Melden Sie sich daher mit Ihrem Google-Konto an. Antragsgenehmigung.

Führen Sie Google Sample aus

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

Wenn Sie "transcribe_streaming_mic.py" ausführen, können Sie die Stimme auf Englisch erkennen.

Ich möchte die japanische Stimme erkennen!

Geben Sie direkt im Programm (in der Hauptfunktion) an, wo die Konfiguration festgelegt ist.

language_code='ja-JP'

Ich möchte Anerkennungskandidaten geben (Phrasenhinweise)!

Warum nicht die Konfiguration in der Hauptfunktion so umschreiben?

    config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=RATE,
        language_code='ja-JP',
        speech_contexts=[speech.types.SpeechContext(
            phrasesHints=["Kita ist gekommen","Ja wirklich"]
        )]
    )

Da "Lesen" jedoch nicht angegeben ist, wird es in Kanji nicht gut erkannt. Es tut uns leid. Wenn jemand weiß, wie man liest, lass es mich wissen, m (_ _) m

Referenzierte Seiten, die oben nicht erwähnt wurden

Offizielles Handbuch https://media.readthedocs.org/pdf/google-cloud-python/latest/google-cloud-python.pdf

Recommended Posts

Streamen Sie die Spracherkennung mithilfe der gRPC-API von Google Cloud Speech mit Python3 auf dem Mac!
Sprachtranskriptionsverfahren mit Python und Google Cloud Speech API
Sprachdateierkennung durch Google Speech API v2 mit Python
Streaming-Spracherkennung mit der Google Cloud Speech API
Sprachtranskriptionsverfahren mit der Google Cloud Speech API
Spracherkennung von WAV-Dateien mit der Google Cloud Speech API Beta
[Python3] Google übersetzt Google Übersetzung ohne Verwendung von API
Ich habe versucht, die Docomo-Spracherkennungs-API und die Google Speech-API in Java zu verwenden
Google Cloud Speech API im Vergleich zu Amazon Transcribe
Google Cloud Vision API-Beispiel für Python
Versuchen Sie, Python mit Google Cloud-Funktionen zu verwenden
Verwenden Sie die Google Cloud Vision-API von Python
Erstellen einer Google-Tabelle mit der Python / Google Data-API
Python auf Mac
Automatische Sprachtranskription mit Google Cloud Speech API
Ich habe versucht, die Google Cloud Vision-API zu verwenden
Tweet (API 1.1) mit Google App Engine für Python
Ausgabe der Repository-Liste mit der Github-API auf dem Mac
[GoogleCloudPlatform] Verwenden Sie die Google Cloud-API mit der API-Clientbibliothek
Laden Sie eine JPG-Datei mit der Google Drive-API in Python hoch
Installieren Sie Python auf dem Mac
Installieren von Python 3 in einer Mac-Umgebung
[Python] Abrufen von Insight-Daten mithilfe der Google My Business-API
Spracherkennung mit Python
Erstellen Sie mit pyenv eine Python-Umgebung auf Ihrem Mac
Installieren Sie Python 3.4 auf einem Mac
Mindestnotizen bei Verwendung von Python auf Mac (pyenv edition)
Mindestnotizen bei Verwendung von Python auf Mac (Homebrew Edition)
Verwenden von NAOqi 2.4.2 Python SDK mit Mac OS X El Capitan
Erstellen Sie eine Ubuntu-Python-Entwicklungsumgebung auf der Google Cloud Platform
Erstellen einer Python-Umgebung auf einem Mac bis zur Verwendung von Jupyter Lab
Zugriff auf Google Spreadsheets Verwenden von Python mit Himbeer-Pi (für sich selbst)
Ein Hinweis beim Berühren der Gesichtserkennungs-API von Microsoft mit Python
Versuchen Sie, Lebensmittelfotos mithilfe der Google Cloud Vision-API zu beurteilen
Lassen Sie uns die Super Resolution API mithilfe der Google Cloud Platform veröffentlichen
Einfach auf dem Mac! Darstellung der Einheitsschrittantwort mit Python
Spielen Sie mit der YouTube Data API v3 mit dem Google API Python Client
Spracherkennung durch Python MFCC
Installieren Sie pygame auf python3.4 auf dem Mac
Alterserkennung mit Peppers API
Umgang mit Python auf Mac
Aktualisieren Sie die Python, die Sie auf Ihrem Mac hatten, auf 3.7-> 3.8
Installieren Sie pandas 0.14 auf python3.4 [auf Mac]
Hinweise zur Installation von Python auf Ihrem Mac
Online-Übertragung mit Python
Google Drive API-Tipps (Python)
Verwenden von OpenCV mit Python @Mac
Erstellen Sie mit Python und Redis eine Rangliste für Spiele in der Alibaba-Cloud
Ansible Playbook zum Konfigurieren von Python-Einstellungen mit pyenv auf dem Mac
[SEO] Flow / Beispielcode bei Verwendung der Google Analytics-API in Python
[Ruby on Rails] Anzeigen und Fixieren von GoolgeMAP mithilfe der Google-API
Erstellen einer Python-Umgebung auf einem Mac
Drucken Sie PDF mit Google Cloud Print. (GoogleAPI)
Wenn Python auf dem Mac verloren geht
Datenerfassung mit Python Googlemap API
[Python] Klicken Sie auf die Google Übersetzungs-API
Hinweise zur Verwendung von MeCab aus Python