蘋果公司正在研發(fā)一種通過(guò)臉部分析能夠讀懂用戶請(qǐng)求的技術(shù),希望能通過(guò)分析情緒來(lái)減少語(yǔ)音被誤解的次數(shù)。
蘋果公司在專利申請(qǐng)?zhí)?0190348037中表示:“智能軟件代理程式可以代理用戶執(zhí)行操作,操作響應(yīng)于用戶輸入的自然語(yǔ)言(例如用戶說(shuō)的一句話)。在某些情況下,智能軟件代理程式采取的操作可能與用戶預(yù)期的操作不匹配。”如抱怨的向Siri說(shuō),能不能別再播這種傷心的歌了,然后Siri就去切歌了,但其實(shí)你的心情還是很需要聽這類型的歌的。
該技術(shù)可以分析視頻輸入中的面部圖像,通過(guò)識(shí)別形狀或動(dòng)作來(lái)確定特定的肌肉或肌肉群是否被激活。
該系統(tǒng)部分功能會(huì)使用面部識(shí)別來(lái)識(shí)別用戶,從而提供定制動(dòng)作,例如打開電子郵件或打開個(gè)人音樂列表進(jìn)行音樂播放。
同時(shí)該技術(shù)還旨在讀懂用戶的情緒。
專利中繼續(xù)寫道:“用戶表達(dá)的信息會(huì)有多個(gè)指標(biāo),比如該表達(dá)是積極的還是消極的,同時(shí)還能判斷用戶的語(yǔ)氣程度?!?/p>
這在能有多種解讀的語(yǔ)音請(qǐng)求里,非常具有實(shí)用性。有了這項(xiàng)技術(shù),Siri能計(jì)算出最可能的含義并對(duì)其進(jìn)行操作,然后使用面部識(shí)別來(lái)查看用戶是滿意還是煩惱。
過(guò)程
接受視頻輸入→識(shí)別視頻輸入中代表用戶面部表情的信息→判斷用戶反應(yīng)→存儲(chǔ)描述用戶反應(yīng)的用戶反應(yīng)信息→根據(jù)用戶的反應(yīng)信息采取相應(yīng)的行動(dòng)