Es scheint, dass die Google API-Oberfläche geändert wurde und nicht so funktioniert, wie sie ist. Wenn Sie die Spracherkennung für Streams in Zukunft noch nicht kennen, lesen Sie bitte den folgenden Artikel von @delete. https://qiita.com/delete/items/395776c6843d67fd65fd
Es ist unten.
Ich möchte eine Stream-Spracherkennung mit der Google Cloud Speech gRPC-API durchführen! (Mit einem einfachen VAD)] http://qiita.com/sayonari/items/a70118a468483967ad34
In diesem Artikel habe ich die Google-Spracherkennung in einer neuen Umgebung durchgeführt, aber sie hat nicht funktioniert. Daher werde ich eine Notiz hinterlassen, wann ich sie von Anfang an installiert habe. Wir konnten es nicht ordnungsgemäß erneut überprüfen. Wenn Sie also Meinungen oder Korrekturen finden, zögern Sie bitte nicht, uns Ihre Meinung mitzuteilen.
google cloud API dashboard https://console.cloud.google.com/?hl=ja Die Methode, die Sprach-API mit der Google Cloud-API verfügbar zu machen, ist ziemlich ärgerlich, aber sie enthält viele Informationen. Bitte googeln Sie sie selbst.
Erstellen Sie ein Projekt mit Ihrem Lieblingsnamen. Ich habe ein Projekt namens "GoogleCloudAPI-ASRtest" gemacht. Wenn Sie SpeechAPI verwenden können, wird die ID in der API angezeigt. Denken Sie also daran.
pip install google.cloud.speech
https://cloud.google.com/sdk/docs/quickstart-mac-os-x?hl=ja
Führen Sie install.sh
aus
gcloud init
Sie werden gefragt "Sie müssen sich anmelden, um fortzufahren. Möchten Sie sich anmelden (J / N)?". Geben Sie also Y ein.
Der Browser wird gestartet. Melden Sie sich daher mit dem bei der API registrierten Google-Konto an.
Unter "Zu verwendendes Cloud-Projekt auswählen:" wird der Name des API-Projekts zusammen mit der Nummer aufgeführt. Wählen Sie daher das Projekt aus, in dem SpeechAPI registriert ist.
「Do you want to configure Google Compute Engine (https://cloud.google.com/compute) Einstellungen (J / N)? ”Wählen Sie den Server als Y aus. Es wurde in "[2] asien-east1-b" geändert.
pip install gcloud
Fügen Sie das installierte Verzeichnis zu PYTHONPATH
hinzu
In meinem Fall war es wie folgt.
export PYTHONPATH="/Users/nishimura/.pyenv/versions/3.6.1/lib/python3.6/site-packages:$PYTHONPATH"
Wenn Sie dies zu ~ / .bash_profile
hinzufügen, wird es jedes Mal automatisch ausgeführt, was praktisch ist.
gcloud auth application-default login
Der Browser wird gestartet. Melden Sie sich daher mit Ihrem Google-Konto an. Antragsgenehmigung.
https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client
Wenn Sie "transcribe_streaming_mic.py" ausführen, können Sie die Stimme auf Englisch erkennen.
Geben Sie direkt im Programm (in der Hauptfunktion) an, wo die Konfiguration festgelegt ist.
language_code='ja-JP'
Warum nicht die Konfiguration in der Hauptfunktion so umschreiben?
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=RATE,
language_code='ja-JP',
speech_contexts=[speech.types.SpeechContext(
phrasesHints=["Kita ist gekommen","Ja wirklich"]
)]
)
Da "Lesen" jedoch nicht angegeben ist, wird es in Kanji nicht gut erkannt. Es tut uns leid. Wenn jemand weiß, wie man liest, lass es mich wissen, m (_ _) m
Offizielles Handbuch https://media.readthedocs.org/pdf/google-cloud-python/latest/google-cloud-python.pdf
Recommended Posts