Es konvertiert Text, der mit der Sprachsynthesefunktion von IBM geschrieben wurde, in natürliche Sprache. Gleich wie Polly in AWS.
Es ist schwer, Pepper dazu zu bringen, gut zu sprechen. Darüber hinaus ist es schwieriger, den Klang einzustellen, da dies ohne die eigentliche Maschine nicht möglich ist. Ich wünschte, ich könnte es mit einem virtuellen Roboter überprüfen, aber das ist nicht der Fall. .. Was macht ihr damit? ?? Kämpfen sie alle? ??
Verwenden Sie also Text to Speech, um den Text in eine Audiodatei zu konvertieren und herunterzuladen. Ich habe versucht, es so zum Sprechen zu bringen, wie es ist.
Wenn Sie in der Aktion auf "Anmeldeinformationen anzeigen" klicken, werden der Benutzername und das Kennwort angezeigt. Verwenden Sie diese Option.
pepper-Beispiel für ein Python-Skript
url = "https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?accept=audio/wav&voice=ja-JP_EmiVoice"
param = {"output" : "hello_world.wav", "text" : message}
filePath = self.appFolder + "/" + self.getParameter("file name")
r = requests.get(url, auth=("{username}", "{password}"), params=param)
outfile = open(filePath, 'wb')
outfile.write(r.content)
outfile.close()
Ich verwende das Python-Anforderungsmodul für http get. Dieser Bereich wird hilfreich sein. http://qiita.com/n0bisuke/items/5b782bb758ce5611cc90
In param werden der Name der Ausgabedatei (Download) und der Text der Konvertierungsquelle festgelegt. Legen Sie in request.get die oben genannten Anmeldeinformationen und Parameter fest und geben Sie eine Anforderung aus
Es wird als "outfile.write (r.content)" an dem Speicherort gespeichert, der in Pepper auf "filePath" festgelegt wurde. Alles was Sie tun müssen, ist es in der Play Sound Box abzuspielen und fertig.
Recommended Posts