Set output_csv_filename and choices_list

212     print('beta:', args.beta)
213     suffix = []
214     if args.beta:
215         suffix.append('beta')
216     else:
217         suffix.append('')
218     
219     print('nr:', args.nr)
220     if args.nr:
221         suffix.append('nr')
222     else:
223         suffix.append('')
224     print('suffix:', '_'.join(suffix))
225     
226 
227     output_csv_filename = os.path.join(output_dir,'transcribe_output_{}.csv'.format('_'.join(suffix)))
228     
229     '''check result csv exist or not'''
230     if os.path.isfile(output_csv_filename) and not(args.reset):
231         df = pd.read_csv(output_csv_filename,index_col=0)
232         existSpeechFileList = df.filename.tolist()
233         choices_list = df.sentence.tolist()
234     else:
235         choices_list = []
236         existSpeechFileList = []

行212-227目的是把不同google api版本跟有預降噪的資訊加到辨識總檔csv名稱的後綴中，方便比較不同方法的效果。

行229-236是偵測總檔是否存在跟程式是否要覆寫已經執行完的辨識。

行230是當總檔存在而且不需要覆寫已經執行完的辨識，此時程式會把總黨的資料讀入為一個pandas.dataframe的變數df，從df中把已經辨識的檔案列表existSpeechFileList跟辨識結果列表choice_list讀取出來。

行235-236代表要重頭開始執行辨識，所以existSpeechFileList跟choice_list都為空的列表。

Set output_csv_filename and choices_list

Set output_csv_filename and choices_list

results matching ""

No results matching ""