《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 扎克伯格實(shí)現(xiàn)今年“小目標(biāo)”:成功打造AI語(yǔ)音助手J.A.R.V.I.S.

扎克伯格實(shí)現(xiàn)今年“小目標(biāo)”:成功打造AI語(yǔ)音助手J.A.R.V.I.S.

2016-12-22

Facebook CEO扎克伯格(Mark Zuckerberg)在今年年初立下個(gè)人目標(biāo),計(jì)劃打造人工智能(AI)語(yǔ)音助手“賈維斯”(J.A.R.V.I.S.),原本預(yù)計(jì)會(huì)在 9 月公開(kāi)成果,卻遲遲沒(méi)有消息,如今扎克伯格總算趕在 2017 年到來(lái)前,告訴大家他已成功打造出賈維斯系統(tǒng),并發(fā)布長(zhǎng)文分享賈維斯的建造過(guò)程與心得。

2016-12-20_javis.png

為了讓 AI 助手具備學(xué)習(xí)與識(shí)別能力,扎克伯格為賈維斯采用多項(xiàng)人工智能技術(shù),包括自然語(yǔ)言處理(Natural Language Processing)、語(yǔ)音與臉部辨識(shí)、增強(qiáng)式學(xué)習(xí)(reinforcement learning),其系統(tǒng)程序則以 Python、PHP 及 Objective-C 等語(yǔ)言編寫(xiě)。平常只要透過(guò)手機(jī)或電腦便能跟賈維斯“說(shuō)話”,進(jìn)一步操控家電設(shè)備、保全系統(tǒng),調(diào)節(jié)室內(nèi)燈光與空調(diào),播放音樂(lè)等。

2016-12-20_javis-1.png

串聯(lián)家中所有設(shè)備

不過(guò)在打造 AI 助手之前,必須先解決家中設(shè)備連網(wǎng)的問(wèn)題。扎克伯格在文章里提到,家中設(shè)備的語(yǔ)言和協(xié)定各有不同,加上仍有許多設(shè)備未有連網(wǎng)功能,因此若要透過(guò) AI 助手操控家中所有設(shè)備,就必須讓所有設(shè)備都連上網(wǎng)。他也建議廠商應(yīng)開(kāi)發(fā)通用的應(yīng)用程序界面(API)及標(biāo)準(zhǔn),好讓各設(shè)備間能夠互相鏈接通訊。


理解自然語(yǔ)言

扎克伯格又以循序漸進(jìn)的方式,讓賈維斯理解人類(lèi)的文字和語(yǔ)音指令。一開(kāi)始先讓賈維斯了解簡(jiǎn)單詞匯如“房間”、“燈”、“打開(kāi)”等做為指令關(guān)鍵字,再教賈維斯學(xué)習(xí)更多同義詞、新詞匯及概念,使賈維斯準(zhǔn)確執(zhí)行不同人所發(fā)出的指令。扎克伯格表示,就算他和妻子 Priscilla 下了差不多的指令,也不見(jiàn)得兩人需求相同,好比說(shuō)同樣的指令但沒(méi)有指明房間位置,扎克伯格所指的可能是辦公室,Priscilla 可能指的是某個(gè)房間,因此要AI助手得學(xué)習(xí)分辨?zhèn)€中差異。

而音樂(lè)在自然語(yǔ)言認(rèn)知上,則是更有趣卻也更復(fù)雜,畢竟單靠關(guān)鍵字無(wú)法一下掌握眾多歌手、歌曲及專(zhuān)輯,但經(jīng)過(guò)不斷“溝通”調(diào)整后,賈維斯能夠分辨差異,并根據(jù)每個(gè)人聽(tīng)音樂(lè)的喜好與模式推薦歌曲。扎克伯格認(rèn)為,當(dāng) AI 助手懂得愈多語(yǔ)意脈絡(luò),愈能處理各種開(kāi)放式、非特定而慣用的指令,而賈維斯也在這樣的“訓(xùn)練”下,表現(xiàn)愈來(lái)愈進(jìn)步。

2016-12-20_javis-2.png

具備視覺(jué)與臉部辨識(shí)功能

為了讓賈維斯擁有視覺(jué)與臉部辨識(shí)能力,扎克伯格在家門(mén)口設(shè)備數(shù)臺(tái)攝影機(jī),讓賈維斯能以多個(gè)角度取得訪客樣貌長(zhǎng)相,并透過(guò)臉部辨識(shí)技術(shù)加以識(shí)別訪客身份。一旦確認(rèn)對(duì)方身份是預(yù)期到訪的客人,賈維斯就會(huì)讓對(duì)方進(jìn)門(mén),同時(shí)知會(huì)扎克伯格。

2016-12-20_javis-3.png

除此之外,視覺(jué)與臉部辨識(shí)功能還能應(yīng)用在許多方面,例如掌握女兒 Max 的動(dòng)態(tài),或是偵測(cè)每個(gè)人的所在位置,借以判斷應(yīng)在哪個(gè)房間、哪個(gè)位置執(zhí)行指令。

溝通靠文字和語(yǔ)音信息、聲控功能

扎克伯格運(yùn)用自家 Messenger 架構(gòu)打造聊天機(jī)器人平臺(tái),以便隨時(shí)隨地透過(guò)手機(jī)傳送文字或語(yǔ)音信息跟賈維斯溝通;賈維斯也會(huì)利用平臺(tái)提醒扎克伯格待辦事項(xiàng),或傳送訪客影像給扎克伯格,告訴他哪位客人來(lái)訪等等。

3066478-inline-i-1-zucklights.gif

扎克伯格跟賈維斯溝通的方式以文字信息居多,連他自己也感到相當(dāng)驚訝。他認(rèn)為主要原因是文字信息的干擾性較低,也能等自己想看時(shí)再看,不受語(yǔ)音信息限制。這其實(shí)也符合 Messenger 和 Whatsapp 等通訊軟件的使用者偏好,也就是慣用文字信息多于語(yǔ)音信息。扎克伯格表示,未來(lái)的 AI 產(chǎn)品不能只著重在語(yǔ)音聲控,還必須具備文字信息界面。

當(dāng)然,扎克伯格并不表示聲控和語(yǔ)音辨識(shí)功能不重要。他為此還開(kāi)發(fā)出聲控專(zhuān)用 app,載入手機(jī)之后便能直接以語(yǔ)音操控賈維斯。

2016-12-20_javis-5.png

持續(xù)改良賈維斯,配音人選將揭曉

這一年來(lái),扎克伯格利用閑暇時(shí)間打造賈維斯,總共耗時(shí)約 100 小時(shí)。他認(rèn)為透過(guò)這次挑戰(zhàn)所學(xué)習(xí)到的事物遠(yuǎn)遠(yuǎn)超出預(yù)期,對(duì)自家工程師所使用的內(nèi)部技術(shù)也更有概念。扎克伯格對(duì)于 Facebook 程序碼數(shù)據(jù)庫(kù)及各種內(nèi)部工具感到相當(dāng)滿意,也因?yàn)檫@些資源,為開(kāi)發(fā)賈維斯節(jié)省了不少時(shí)間。

雖然目前已成功打造出賈維斯,扎克伯格坦言還是有許多地方有待改善,接下來(lái)會(huì)想辦法教賈維斯自行學(xué)習(xí)新技能,而不是教他執(zhí)行特定任務(wù)。

2016-12-20_javis-6.png

 扎克伯格未透露賈維斯配音人選,僅表示即將揭曉

扎克伯格即將在明年初分享新年新挑戰(zhàn),至于先前網(wǎng)友們熱烈討論的賈維斯配音人選問(wèn)題,他則是賣(mài)關(guān)子表示,賈維斯的“真聲”即將會(huì)在接下來(lái)發(fā)布的影片中揭曉。

Zuckerberg-jarvis-robert.jpg

鋼鐵俠扮演者羅伯特·唐尼(Robert Downey)曾經(jīng)表示愿意在特定情況下為賈維斯配音。但扎克伯格還是將決定權(quán)交給公眾。他的Facebook帖子共收到5萬(wàn)多條評(píng)論,根據(jù)大眾的投票,賈維斯很有可能使用美國(guó)影星摩根·弗里曼(Morgan Freeman)的聲音。

扎克伯格表示,他給弗里曼打電話說(shuō):“嘿,我發(fā)了這樣一個(gè)帖子,有好幾千人想讓你來(lái)配音。你愿意嗎?”弗里德曼回答道:“當(dāng)然愿意?!?/p>

Zuckerberg-jarvis-morgen.jpg

摩根·弗里曼曾在電影《冒牌天神》中飾演上帝

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。