內容提要:微軟研究員本周宣布,微軟經過訓練的神經網絡已可以像人工一樣識別人類的語音
北京時間10月19日早間消息,微軟研究員本周宣布,微軟經過訓練的神經網絡已可以像人工一樣識別人類的語音。
在周一發布的報告中,微軟讓NIST 2000自動化系統與專業速記員進行了比賽。結果顯示,自動化系統的錯誤率首次低於人工。報告稱:『這是會話語音領域首次報告的(自動化系統)達到人工水平。』
更強大的語音識別系統可以給未來的微軟產品帶來一系列影響。
關於這一成就,微軟在官方博客中表示:『這一裡程碑將給用戶和商業產品帶來廣泛影響,語音識別技術將帶來明顯的增強。這其中包括類似Xbox的用戶娛樂設備、實時語音文本轉換等無障礙訪問工具,以及類似Cortana的語音助手。』
微軟CEO薩蒂亞·納德拉(Satya Nadella)宣布,會話技術對計算機的重要性將堪比圖形用戶界面(GUI),而這樣的會話將在不久的將來進入所有計算設備。
今年早些時候,通過與華盛頓大學和斯坦福大學合作,百度研究院宣布,百度Deep Speech 2的語音速記速度比人工打字快3倍。
會話語音識別領域的許多早期進展都來自美國國防部高級研究計劃局(DARPA)。該部門從70年代開始就已展開了語音識別研究。