Run Google Cloud Speech Recognition
083 client = speech.SpeechClient()
084
085 with io.open(speech_file, 'rb') as audio_file:
086 content = audio_file.read()
087
088 audio = types.RecognitionAudio(content=content)
089
090 response = client.recognize(config, audio)
行83~90是完整的google cloud speech recognition的操作。
行83建立一個speech.SpeechClient
的程序(process),負責跟google cloud service的溝通。
行85-86是把speech_file
音頻檔以二進位檔讀入,存在content
變數裡。
行88是把content
透過types.RecognitionAudio
函數轉換成google speech-to-text api可以辨識的音頻格式audio
。
行90是透過client.recognize
函數把config
跟audio
上傳到google cloud server,server把轉譯完的結果傳回來,存在response
變數裡。