Google Speech API 使用記錄
2 min readNov 1, 2017
解構
- 使用這個功能主要是先有一個google cloud platform的帳號
- 啟用一個專案,並且啟用 google speech api,最後拿到使用金鑰
- HOST: speech.googleapis.com
- method: POST
- endpoint: /v1/speech:longrunningrecognize
- queryString: key
範例
[POST] https://speech.googleapis.com/v1/speech:longrunningrecognize?key=<key>body{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 8000,
"language_code": "cmn-Hant-TW",
"enableWordTimeOffsets": false },
"audio": {
"uri":"gs://<bucket_name>/<file_name>"
}
}
回傳範例
{
"name": "7612202767953098924"
}
因為這是使用speech:longrunningrecognize,所以在等待一段時間之後,可以透過這次回傳的資料operation name的資訊。在拿到完整的翻譯資訊
[GET] https://speech.googleapis.com/v1/operations/OPERATION_NAME?key=API_KEY
最後說明
- 聲音檔要轉成flac格式,並且為單聲道,同時也要確認音頻[待補,找到更優雅的做法]