利用 python 套件 SpeechRecognition 進行語音辨識

YingTing 2018/08/05

Fig.1 語音轉文字範例

語音辨識使用 Python 中的 SpeechRecognition module。輸入是麥克風或是語音檔,輸出是文字。

type pip install SpeechRecognition to download SpeechRecognition module

如果使用麥克風作為音源輸入,則需要安裝 installportaudio19-devpython-pyaudio, python3-pyaudio 以及 pyaudio

 apt-get installportaudio19-devpython-pyaudio python3-pyaudio
 pip install pyaudio

Input a audio file (.wav)

import speech_recognition
r = speech_recognition.Recognizer()

with speech_recognition.AudioFile("/path/test.wav") as source:
     audio = r.record(source)

r.recognize_google(audio,language='zh-tw')

以上程式將測試檔案 "/path/test.wav" 先轉成 python 的物件 audio
接著在用下面的指令將語音檔經由你所設定的語音辨識 api 轉成文字

r.recognize_google(audio,language='zh-tw')

這邊我使用的是 google 的 api,預設套件中有不少語音的 api ,但其他的都需要 api 的 key,也就是你需要去申請對應的服務,拿到對應的 key 才能測試,所以這邊用免申請的 google 服務做示範。

Input from microphone


Reference

[0] 簡單利用 python 套件 SpeechRecognition 進行語音辨識 http://www.chiehfuchan.com/%E7%B0%A1%E5%96%AE%E5%88%A9%E7%94%A8-python-%E5%A5%97%E4%BB%B6-speechrecognition-%E9%80%B2%E8%A1%8C%E8%AA%9E%E9%9F%B3%E8%BE%A8%E8%AD%98/

[1] SpeechRecognition module https://pypi.org/project/SpeechRecognition/

results matching ""

    No results matching ""