在李宏毅比賽裡面,有提供訓練的資料
- wav.zip 320 wav files named by index, 音檔的內容格式為spoken conversation/article + question + choices,spoken conversation/article 跟後面question+choice中間有個明亮的叮聲區隔,因為人聲頻率會在2k~20kHz之間,叮聲頻率為40kHz,所以可以用簡單frequency來分開,不過因為還沒找到相關的資料,所以這邊我們使用Mac Quicktime把spoken conversation裁剪出來,如Figure 1所示。