'搜狗推“個性化語音識別”,將顛覆與改變未來人機交互模式'

"

專業機構發佈《2019年語音技術》報告稱,語音將成為未來十年決定性主題之一,與人工智能一起從根本上改變人與機器的關係。近日,搜狗輸入法在語音輸入領域率先推出“個性化語音識別”功能,突破語音識別技術瓶頸,大幅優化個人詞彙錄入的直接準確性,在語音輸入領域實現“更懂用戶”。

"

專業機構發佈《2019年語音技術》報告稱,語音將成為未來十年決定性主題之一,與人工智能一起從根本上改變人與機器的關係。近日,搜狗輸入法在語音輸入領域率先推出“個性化語音識別”功能,突破語音識別技術瓶頸,大幅優化個人詞彙錄入的直接準確性,在語音輸入領域實現“更懂用戶”。

搜狗推“個性化語音識別”,將顛覆與改變未來人機交互模式


搜狗“個性化語音識別”打造用戶專屬輸入法

在日常交流中,個人口頭禪、慣用語經常會干擾雙方的信息傳達,這一問題在人機語音交互中尤為凸顯。在語音輸入時,往往用戶只是想錄入一個名稱,輸入結果卻顯示的是音同意不同的另一項結果。比如,當用戶希望輸入法顯示人名“憑遠”時,通用的語音識別往往將大眾常用的“平原、品源”列在前列的候選詞彙,用戶的個性化內容並不在其中。除此之外,用戶習慣使用的個人詞彙,以及一些多音字、讀音差錯也會對語音識別結果造成影響。

基於以上原因,搜狗語音率先對語音識別技術進行了革新優化,推出“個性化語音識別”服務。經過本輪更新,用戶只需在搜狗輸入法App選擇一鍵登錄個人賬戶,即可體驗此項服務。成功開啟後,“個性化語音識別”會通過強化學習用戶習慣使用的個人詞彙,為每個用戶建立定製化語音輸入法。此後,在用戶需要進行語音輸入時,輸入法會根據語言環境,結合上下段落語句進行分析,快速輸出符合用戶心意的文本內容,有效減少用戶手動進行二次更改的頻率。

搜狗語音又誕生“黑科技”語音識別更精準

搜狗“個性化語音識別”不僅可有效提升用戶個性化詞句的識別準確率,同時全自動詞庫學習這一特色極大保證了系統的處理及反饋速度,實現整個學習個性化特徵的過程在“毫秒級別”就可以全部自動完成。

通過DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學模型、神經網絡語言模型和智能標點預測等技術,搜狗輸入法引入前沿深度學習技術,對語音識別進行仿真模擬和訓練,有效提高語音錄入在通用場景下的識別準確性,精準度已達到領先業內。“個性化語音識別”可基於用戶數據分析,對用戶習慣使用的個性化詞組進行掃描記錄,在語音輸入時,優先選擇用戶習慣用語進行文本輸出。通過此項技術革新,在保障通用識別準確性的前提下,使用戶常用語的字詞錯誤率下降40%,攻克語音識別精準化的技術難關。

掌控AI從個性化語音識別開始

手和舌頭是人類最靈活的兩個部分,從移動智能設備發展以來,各種觸控交互無不依賴於手的操作。而當語音技術和人工智能同時走向成熟時,或許就像《2019語音技術報告》中所描述的那樣:語音交互扭轉了以往人機交互的存在形態,用戶與設備間基於語音交互的全新關係開始搭建,與之前互聯網向移動互聯網過渡一樣,其對底層平臺的全新需求也在醞釀當中。

新時代即將來臨,為應對人工智能、虛擬現實等技術的革新以及不同維度、多場景使用的需要,用戶輸入法的使用習慣逐漸向語音輸入轉移。同時,與文本輸入相比,語音輸入註定成為最主要的人機互動接口。優化語音識別技術,為用戶提供更自然、更便利、更高效的語音錄入服務,是智慧輸入法的發展趨勢。

隨著語音識別技術的不斷成熟,以及用戶個性化詞庫的不斷豐富,搜狗將聚合用戶級語音個性化資源,實現“定製化語音輸入法”。使每個用戶基於“定製版”、“更懂自己”的搜狗語音識別的支持,在日常生活以及醫療、法律等專業領域,有效提高線上交流和人機溝通的效率及準確度,或將成為人工智能時代輸入端的全局掌控者。

"

相關推薦

推薦中...