微軟逆天突破全雙工語音交互!機器人真變成了「人」

2018年03月23日     檢舉

微軟(亞洲)網際網路工程院宣布,率先推出新一代的語音交互技術「全雙工語音交互感官」(Full-duplex Voice Sense),並已完成產品化落地。

全雙工本是通訊傳輸領域的一個術語,允許數據在兩個方向上同時傳輸,與之對應的就是半雙工。

傳統的語音識別和機器對話都類似半雙工,無論單輪還是多輪連續識別,都需要人說完一句話,機器才能理解並給出回應,有點像傳統武俠遊戲的回合式戰鬥。

贊助商鏈接

而微軟的這項新技術可以實時預測人類即將說出的內容,實時生成回應,並控制對話節奏,從而使長程語音交互成為可能。

採用該技術的智能硬體設備,也不需要用戶在每輪交互時都說出喚醒詞,僅需一次喚醒,就可以輕鬆實現連續對話,使人與機器的對話更像人與人的自然交流。

目前,這項技術已首先在微軟小冰全球產品線中落地,其中在中國市場,不但有中國科技館的小冰電話亭,微軟還與小米緊密合作,將其融入到米家生態鏈Yeelight語音助手的市售硬體產品。

這是全球首個搭載全雙工語音交互感官的智能設備,也是內置微軟小冰的首個「雙AI」智能設備。

贊助商鏈接

在日本市場,小冰凜菜(りんな)已通過該技術實現在直播平台中的落地,首個車載智能項目也已開始路試。

微軟計劃在未來六個月內,完成該技術在更多產品線中的覆蓋。

微軟全球資深副總裁、微軟(亞洲)網際網路工程院院長王永東博士表示:「我們預測,未來一年中,人工智慧應用將越來越多地從某些單一技術領域,進入到發揮綜合能力的階段。微軟已在這方面深入布局。此次全雙工語音交互技術的推出,不僅涉及到計算機語音技術,還包括自然語言處理、人工智慧內容創造等多個領域。這正是微軟在這些領域長期儲備、綜合運用的成果之一。」

微軟小冰全球研發負責人周力博士表示:「從已落地的產品數據和用戶反饋中,我們觀察到一個普遍現象:用戶一旦使用過微軟小冰的全雙工語音交互感官之後,再與其他語音助手交互時,他們普遍會開始感到不習慣,甚至會頻繁忘記要對其他語音助手說喚醒詞——新技術促進擬人自然度的顯著提升,使人們對過去單輪或多輪連續語音交互體驗的滿意度迅速下降。這種新老交替的現象,符合我們的研發預期。」

贊助商鏈接

相關閱讀