利用 python 套件 SpeechRecognition 進行語音辨識
YingTing 2018/08/05
Fig.1 語音轉文字範例
語音辨識使用 Python 中的 SpeechRecognition module。輸入是麥克風或是語音檔,輸出是文字。
type pip install SpeechRecognition
to download SpeechRecognition module
如果使用麥克風作為音源輸入,則需要安裝 installportaudio19-devpython-pyaudio, python3-pyaudio 以及 pyaudio
apt-get installportaudio19-devpython-pyaudio python3-pyaudio
pip install pyaudio
Input a audio file (.wav)
import speech_recognition
r = speech_recognition.Recognizer()
with speech_recognition.AudioFile("/path/test.wav") as source:
audio = r.record(source)
r.recognize_google(audio,language='zh-tw')
以上程式將測試檔案 "/path/test.wav" 先轉成 python 的物件 audio
接著在用下面的指令將語音檔經由你所設定的語音辨識 api 轉成文字
r.recognize_google(audio,language='zh-tw')
這邊我使用的是 google 的 api,預設套件中有不少語音的 api ,但其他的都需要 api 的 key,也就是你需要去申請對應的服務,拿到對應的 key 才能測試,所以這邊用免申請的 google 服務做示範。
Input from microphone
Reference
[0] 簡單利用 python 套件 SpeechRecognition 進行語音辨識 http://www.chiehfuchan.com/%E7%B0%A1%E5%96%AE%E5%88%A9%E7%94%A8-python-%E5%A5%97%E4%BB%B6-speechrecognition-%E9%80%B2%E8%A1%8C%E8%AA%9E%E9%9F%B3%E8%BE%A8%E8%AD%98/
[1] SpeechRecognition module https://pypi.org/project/SpeechRecognition/