智能語(yǔ)音交互對(duì)人們生活的影響正在潛移默化地發(fā)生。以前,人們還習(xí)慣于通過(guò)鍵盤(pán)和觸控屏操控智能設(shè)備,而三到五年內(nèi),科學(xué)家認(rèn)為人們或許可以隨時(shí)給身邊智能設(shè)備、機(jī)器人下達(dá)指令,幫助訂餐、訂票,乃至端茶遞水。
過(guò)去,機(jī)器對(duì)語(yǔ)音識(shí)別度不高,對(duì)自然語(yǔ)言的語(yǔ)義更難以理解,阻礙了語(yǔ)音交互的應(yīng)用。
但僅僅在一兩年內(nèi),隨著降噪技術(shù)、方言識(shí)別、“雙工多輪交互”技術(shù)、機(jī)器學(xué)習(xí)技術(shù)的發(fā)展、對(duì)語(yǔ)音的準(zhǔn)確識(shí)別,乃至對(duì)語(yǔ)義的準(zhǔn)確理解,讓機(jī)器準(zhǔn)確理解并執(zhí)行人類(lèi)指令成為可能。
“以語(yǔ)音和語(yǔ)言為入口的認(rèn)知革命,將推動(dòng)人工智能夢(mèng)想成真。這是一條人工智能走認(rèn)知計(jì)算的必由之路?!庇煽拼笥嶏w研發(fā)的最新技術(shù),實(shí)時(shí)文字同傳了科大訊飛董事長(zhǎng)劉慶峰的演講。
“(原來(lái))我問(wèn)一次北京明天天氣,然后可以再問(wèn)上海明天天氣。而現(xiàn)在我可以問(wèn)北京明天天氣,然后直接問(wèn)‘上海的呢?’,它馬上就知道上下文相關(guān)。”劉慶峰說(shuō)。
同時(shí),在機(jī)器回答問(wèn)題時(shí),人類(lèi)今后也可以隨時(shí)打斷,插入新的指令和話題。
方言、環(huán)境噪音,都可能影響語(yǔ)音識(shí)別準(zhǔn)確度,而劉慶峰表示,最新的科技,結(jié)合了方言、降噪、“雙工多輪”等技術(shù),2015年將語(yǔ)音識(shí)別準(zhǔn)確度由40%已提升至90%。
讓機(jī)器執(zhí)行人類(lèi)語(yǔ)音指令,識(shí)別是首要前提,但接下來(lái)另一個(gè)重要課題是如何讓機(jī)器理解自然語(yǔ)言語(yǔ)義,而這也涉及更深層次“人工智能”。
過(guò)去60年中,人工智能掀起過(guò)兩波浪潮,從證明數(shù)學(xué)原理,到大規(guī)模神經(jīng)網(wǎng)絡(luò)出現(xiàn)。直到2006年,機(jī)器“深度學(xué)習(xí)”正式提出,并被證明可用于大規(guī)模神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,海量的數(shù)據(jù)給予機(jī)器學(xué)習(xí)資源,卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)技術(shù),在語(yǔ)音交互方面逐步獲得應(yīng)用。