Kaggle1

README

A目錄中有223題需更換,以更正檔名跟取樣率

目錄結構

├── A # 目錄A存放題目文章

├── B和C(需要密碼解壓縮).zip # 目錄B為問題;C為答案

├── Kaggle UserName.csv # 報名名單(僅kaggle名稱)

├── Kaggle答題-編號不連續-空白.csv # 回傳答案格式範例

└── README.md

規則

比賽時間:2018/6/23 (UTC+08:00)台北時間 11:00 AM~12:00 PM開啟,共計1小時。

Kaggle競賽連結:已於Gitlab公布,目前無法連線是正常。

登入時間於2018/6/23 (UTC+08:00)台北時間 09:00 AM開放.。

繳交限制:一小時內每位參賽隊伍最多只能上傳5次,比賽結束時可以選擇1筆上傳結果做為評分依據。

參賽規則:每隊參賽隊伍僅能使用一個帳號,註冊多個Kaggle帳號來取得更多上傳次數是違背競賽規則,團隊分數將不列入採計。

參賽名稱:請確保所有團隊所填寫的Kaggle名稱和官網報名時一致,將會於Gitlab上公布所有報名名單(僅kaggle名稱),如有不同還請寄信告知。

其餘規則:一律根據官網上的說明及註冊參賽時規章為主。

檔案

1 比賽音檔:請至Gitlab Kaggle1專案下載文章音檔,文章音檔(不加密),問題和選項音檔會預先加密壓縮,密碼將於比賽前半小時發佈,壓縮檔提前提供下載,請大家密切注意官網及FB。

2 壓縮密碼:將於2018/6/23 (UTC+08:00)台北時間 10:30 AM 於Gitlab、官網、FB公布壓縮檔密碼。

3 取樣格式:單聲道(Mono),16kHz,16 bits PCM 。

4 音檔格式:*.wav 。

5 音檔數量:一組包含[文章*1、題目*1、選項*1],共1500組 。

6 檔案命名:

A文章:A0000001.wav,範例 A0000001.wav

B題目:B0000001.wav,範例 B0000001.wav

C選項:C0000001.wav,範例 C0000001.wav

7 上傳格式:採用csv檔上傳,逗號分割

8 欄位ID為題目編號(檔名去掉英文、數字前面補的0和副檔名.wav),不連續編號

9 欄位Answer為答案請填數字1到4

10 範例已上傳至Gitlab Kaggle1專案

語料庫(必做)

檔案1:單純語音辨認器辨認出的逐字稿的文字結果跟對應的記錄檔,尤其是字或詞的信心值分數。

檔案2:經後級NLP或是其他方式校正過的逐字稿的文字結果跟對應的記錄檔,尤其是字或詞的信心值分數。

檔案3:每題四個答案的分數。

檔案4:說明檔,解釋上傳的檔案1~3的內容與格式。

檔案5:系統描述,說明系統架構與做法

上傳方式:於gitlab建立名稱為Kaggle1的專案,並將5個檔案上傳。

請於2018/6/25 (UTC+08:00)台北時間 12:00 AM前,將所有檔案上傳至Gitlab專案

[0]

https://speech.nchc.org.tw/GrandChallenge/kaggle1

results matching ""

    No results matching ""