Automatic Speech Recognition & Assessment (ASRA) Library
ASRA is a C++ Library developed at MIR lab, Taiwan.
Speech recognition is mainly voice command recogntion.
Speech assessment is also known as pronunciation scoring.
Current version of ASRA support following languages:
- English
- Chinese (Mandarin)
- Japanese [beta]
- Taiwanese [beta]
Current version of ASRA support MS windows and Unix/Linux platform.
ASRA only provides APIs for speech recognition and assessment. For training acoustic models, you should refer to HTK(Hidden Markov Model Toolkit).
ASRA for Chinese
此說明適用於UNIX平台。 請由下列網址下載ASRA package ASRA package for Chinese on Unix/Linux
語音辨識
主要程式是vcLibFile.cpp
,放在mainProgram
資料夾內。
直接執行bash goMainCompile.sh
,可對mainProgram
下的所有主程式進行編譯。(在編譯前,請確認系統有安裝g++,並且加入搜尋路徑。)
編譯後產生vcLibFile
,用法如下
vcLibFile <recogParamFile> <wavFile> <txtFile>
recogParamFile
參數檔,紀錄語音辨識所用到的各種參數。wavFile
語音檔案,紀錄使用者錄製的音頻,檔案格式必須是16KHz, 16-bit, Mono, 錄音長度不超過10秒。txtFile
文字檔案,紀錄可辨識的文具,每一句必須換列。所支援的文字格式是中文大五碼(big5)。
下達上述命令後,程式會根據語音內容進行比對,由可辨識的文句中,選出最有可能的句子,並用介於0到100之間的分數來代表其信心度(confidence measure)。
除了辨識外,也內建標注音功能,甚至考慮文句所對應的所有可能注音組合。例如『朝辭白帝彩雲間』對應到四種唸法,都可以讓系統進行正確的辨識:
- 朝(ㄓㄠ)辭白(ㄅㄞˊ)帝彩雲間
- 朝(ㄓㄠ)辭白(ㄅㄛˊ)帝彩雲間
- 朝(ㄔㄠˊ)辭白(ㄅㄞˊ)帝彩雲間
- 朝(ㄔㄠˊ)辭白(ㄅㄛˊ)帝彩雲間
範例
可辨識文句的檔案tangPoem3223.txt
,包含唐詩三百首的每一句,總共3223句唐詩。首先開啟Terminal視窗,改變目錄至ASRA的主目錄。
- type
mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/朝辭白帝彩雲間01.wav testInputChinese/tangPoem3223.txt
,辨識結果是『朝辭白帝彩雲間』。朝辭白帝彩雲間01.wav的唸法是『朝(ㄓㄠ)辭白(ㄅㄞˊ)帝彩雲間』,分數是84.8051。 - type
mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/朝辭白帝彩雲間02.wav testInputChinese/tangPoem3223.txt
,辨識結果是『朝辭白帝彩雲間』。朝辭白帝彩雲間01.wav的唸法是『朝(ㄔㄠˊ)辭白(ㄅㄛˊ)帝彩雲間』,分數是89.194。 - type
mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/長安不見使人愁.wav testInputChinese/tangPoem3223.txt
,辨識結果是『長安不見使人愁』,分數是89.8734。 - type
mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/主人下馬客在船.wav testInputChinese/tangPoem3223.txt
,辨識結果是『主人下馬客在船』,分數是96.3018。
[0] http://mirlab.org/jang/books/audioSignalProcessing/asraIntro.asp?title=20-1%20Introduction