Automatic Speech Recognition & Assessment (ASRA) Library

ASRA is a C++ Library developed at MIR lab, Taiwan.

Speech recognition is mainly voice command recogntion.

Speech assessment is also known as pronunciation scoring.

Current version of ASRA support following languages:

  • English
  • Chinese (Mandarin)
  • Japanese [beta]
  • Taiwanese [beta]

Current version of ASRA support MS windows and Unix/Linux platform.

ASRA only provides APIs for speech recognition and assessment. For training acoustic models, you should refer to HTK(Hidden Markov Model Toolkit).

ASRA for Chinese

此說明適用於UNIX平台。 請由下列網址下載ASRA package:\colon ASRA package for Chinese on Unix/Linux

語音辨識

主要程式是vcLibFile.cpp,放在mainProgram資料夾內。 直接執行bash goMainCompile.sh,可對mainProgram下的所有主程式進行編譯。(在編譯前,請確認系統有安裝g++,並且加入搜尋路徑。) 編譯後產生vcLibFile,用法如下:\colon

vcLibFile <recogParamFile> <wavFile> <txtFile>
  • recogParamFile:\colon 參數檔,紀錄語音辨識所用到的各種參數。
  • wavFile:\colon 語音檔案,紀錄使用者錄製的音頻,檔案格式必須是16KHz, 16-bit, Mono, 錄音長度不超過10秒。
  • txtFile:\colon 文字檔案,紀錄可辨識的文具,每一句必須換列。所支援的文字格式是中文大五碼(big5)。

下達上述命令後,程式會根據語音內容進行比對,由可辨識的文句中,選出最有可能的句子,並用介於0到100之間的分數來代表其信心度(confidence measure)。

除了辨識外,也內建標注音功能,甚至考慮文句所對應的所有可能注音組合。例如『朝辭白帝彩雲間』對應到四種唸法,都可以讓系統進行正確的辨識:

  • 朝(ㄓㄠ)辭白(ㄅㄞˊ)帝彩雲間
  • 朝(ㄓㄠ)辭白(ㄅㄛˊ)帝彩雲間
  • 朝(ㄔㄠˊ)辭白(ㄅㄞˊ)帝彩雲間
  • 朝(ㄔㄠˊ)辭白(ㄅㄛˊ)帝彩雲間

範例

可辨識文句的檔案tangPoem3223.txt,包含唐詩三百首的每一句,總共3223句唐詩。首先開啟Terminal視窗,改變目錄至ASRA的主目錄。

  1. type mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/朝辭白帝彩雲間01.wav testInputChinese/tangPoem3223.txt,辨識結果是『朝辭白帝彩雲間』。朝辭白帝彩雲間01.wav的唸法是『朝(ㄓㄠ)辭白(ㄅㄞˊ)帝彩雲間』,分數是84.8051。
  2. type mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/朝辭白帝彩雲間02.wav testInputChinese/tangPoem3223.txt,辨識結果是『朝辭白帝彩雲間』。朝辭白帝彩雲間01.wav的唸法是『朝(ㄔㄠˊ)辭白(ㄅㄛˊ)帝彩雲間』,分數是89.194。
  3. type mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/長安不見使人愁.wav testInputChinese/tangPoem3223.txt,辨識結果是『長安不見使人愁』,分數是89.8734。
  4. type mainProgram/vcLibFile testInputChinesechinese.vc.prm testInputChinese/主人下馬客在船.wav testInputChinese/tangPoem3223.txt,辨識結果是『主人下馬客在船』,分數是96.3018。

[0] http://mirlab.org/jang/books/audioSignalProcessing/asraIntro.asp?title=20-1%20Introduction

results matching ""

    No results matching ""