Set output_csv_filename and choices_list
212 print('beta:', args.beta)
213 suffix = []
214 if args.beta:
215 suffix.append('beta')
216 else:
217 suffix.append('')
218
219 print('nr:', args.nr)
220 if args.nr:
221 suffix.append('nr')
222 else:
223 suffix.append('')
224 print('suffix:', '_'.join(suffix))
225
226
227 output_csv_filename = os.path.join(output_dir,'transcribe_output_{}.csv'.format('_'.join(suffix)))
228
229 '''check result csv exist or not'''
230 if os.path.isfile(output_csv_filename) and not(args.reset):
231 df = pd.read_csv(output_csv_filename,index_col=0)
232 existSpeechFileList = df.filename.tolist()
233 choices_list = df.sentence.tolist()
234 else:
235 choices_list = []
236 existSpeechFileList = []
行212-227目的是把不同google api版本跟有預降噪的資訊加到辨識總檔csv名稱的後綴中,方便比較不同方法的效果。
行229-236是偵測總檔是否存在跟程式是否要覆寫已經執行完的辨識。
行230是當總檔存在而且不需要覆寫已經執行完的辨識,此時程式會把總黨的資料讀入為一個pandas.dataframe
的變數df
,從df
中把已經辨識的檔案列表existSpeechFileList
跟辨識結果列表choice_list
讀取出來。
行235-236代表要重頭開始執行辨識,所以existSpeechFileList
跟choice_list
都為空的列表。