我們的觀點
幸芸: 有一篇paper可能直接相關
Towards machine comprehension of spoken content: Initial TOEFL listening comprehension test by machine.arXiv preprint arXiv:1608.06378.
Tseng, B. H., Shen, S. S., Lee, H. Y(李宏毅)., & Lee, L. S. (2016).
另外一提,在李宏毅的RNN那堂課video2有提到這個工作。
這篇paper用到的data有公開在
https://github.com/iamyuanchung/TOEFL-QA
但所用的model 架構的程式碼應該沒有公開。要自己implement
(或再搜尋看看有沒有比較接近直接可以run的公開程式碼)
然後再用同樣的架構,換成華語文能力測驗的題目
,這部分的相關的data。在國家華語測驗推動工作委員會有一些免費試題可以下載
https://www.sc-top.org.tw/mocktest.php
但量看起來不多
在這篇paper之後 還有一篇相關,看起來像上一篇方法的改進。
Hierarchical attention model for improved machine comprehension of spoken content.
Fang, W., Hsu, J. Y., Lee, H. Y(李宏毅)., & Lee, L. S. (2016, December). In Spoken Language Technology Workshop (SLT), 2016 IEEE (pp. 232-238). IEEE.
這一篇他在課堂講義只有show結果。和FB AI group的結果作比較