Google Speech-to-text

[0] https://cloud.google.com/speech-to-text/

Google Cloud Speech-to-Text

採用機器學習技術將語音轉換成文字,不論音訊長短都能適用。

Google Cloud Speecht-to-Text API功能

Google Cloud Speecht-to-Text API的功能包含

1 將音訊轉換成文字。

2 辨識超過 120 種語言和方言

3 此處理即時播送或預先錄製的音訊(串流音訊)。您可以透過應用程式的麥克風串流處理音訊輸入內容,或是透過預先錄製的音訊檔案傳送 (採用內嵌方式或透過 Google Cloud Storage)。我們支援多種音訊編碼格式,包括 FLAC、AMR、PCMU 及 Linear-16。

4 過濾文字轉換結果中的不當內容。

5 辨識現實生活中會出現的語彙,協助您正確無誤地轉錄各種專有名詞 (例如 Sundar Pichai),轉錄出來的文字也符合正確的語言格式 (例如日期、電話號碼)。與整部牛津英語辭典中的單詞數量相比,Google 支援的專有名詞數量超過 10 倍。

6 提供多種預先建置的辨識模型,可讓您根據自身的使用情況 (例如語音指令) 來調整最佳設定。舉例來說,我們預先建置的影片語音轉錄模型採用與 YouTube 字幕功能類似的機器學習技術,很適合用於為影片建立索引或加上字幕。您可以選擇使用 4 種預先建置的模型:預設、語音指令及搜尋、電話和影片語音轉錄。

7 文字提示。只要事先設定在特定情況下使用者可能會說出哪些單字或詞彙,便能獲得客製化的語音辨識結果。不論是要將自訂的字詞和名稱加到詞彙庫中,或是在應用聲控機制時,您都會發現這項功能十分有用。

8 抗雜訊。能夠處理各種環境雜訊,而不需要額外消除噪音。

9 過濾不當內容。針對部分語言過濾文字轉換結果中的不當內容。

10 自動加上標點符號。採用機器學習技術,為轉錄內容加上正確的標點符號 (逗號、問號和句號)。

CLOUD SPEECH-TO-TEXT API 定價

您可以使用 60 分鐘的免費版,之後系統就會依據 Cloud Speech-to-Text 處理的音訊長度向您收費 (計費單位為 15 秒)。

results matching ""

    No results matching ""