123,123,123

扎克伯格实现今年“小目标”：成功打造AI语音助手J.A.R.V.I.S.

日期： 2016-12-22

關(guān)鍵詞： 扎克伯格 AI 人工智能技术

Facebook CEO扎克伯格（Mark Zuckerberg）在今年年初立下個(gè)人目標(biāo)，計(jì)劃打造人工智能（AI）語音助手“賈維斯”（J.A.R.V.I.S.），原本預(yù)計(jì)會(huì)在 9 月公開成果，卻遲遲沒有消息，如今扎克伯格總算趕在 2017 年到來前，告訴大家他已成功打造出賈維斯系統(tǒng)，并發(fā)布長(zhǎng)文分享賈維斯的建造過程與心得。

為了讓 AI 助手具備學(xué)習(xí)與識(shí)別能力，扎克伯格為賈維斯采用多項(xiàng)人工智能技術(shù)，包括自然語言處理（Natural Language Processing）、語音與臉部辨識(shí)、增強(qiáng)式學(xué)習(xí)（reinforcement learning），其系統(tǒng)程序則以 Python、PHP 及 Objective-C 等語言編寫。平常只要透過手機(jī)或電腦便能跟賈維斯“說話”，進(jìn)一步操控家電設(shè)備、保全系統(tǒng)，調(diào)節(jié)室內(nèi)燈光與空調(diào)，播放音樂等。

串聯(lián)家中所有設(shè)備

不過在打造 AI 助手之前，必須先解決家中設(shè)備連網(wǎng)的問題。扎克伯格在文章里提到，家中設(shè)備的語言和協(xié)定各有不同，加上仍有許多設(shè)備未有連網(wǎng)功能，因此若要透過 AI 助手操控家中所有設(shè)備，就必須讓所有設(shè)備都連上網(wǎng)。他也建議廠商應(yīng)開發(fā)通用的應(yīng)用程序界面（API）及標(biāo)準(zhǔn)，好讓各設(shè)備間能夠互相鏈接通訊。

理解自然語言

扎克伯格又以循序漸進(jìn)的方式，讓賈維斯理解人類的文字和語音指令。一開始先讓賈維斯了解簡(jiǎn)單詞匯如“房間”、“燈”、“打開”等做為指令關(guān)鍵字，再教賈維斯學(xué)習(xí)更多同義詞、新詞匯及概念，使賈維斯準(zhǔn)確執(zhí)行不同人所發(fā)出的指令。扎克伯格表示，就算他和妻子 Priscilla 下了差不多的指令，也不見得兩人需求相同，好比說同樣的指令但沒有指明房間位置，扎克伯格所指的可能是辦公室，Priscilla 可能指的是某個(gè)房間，因此要AI助手得學(xué)習(xí)分辨?zhèn)€中差異。

而音樂在自然語言認(rèn)知上，則是更有趣卻也更復(fù)雜，畢竟單靠關(guān)鍵字無法一下掌握眾多歌手、歌曲及專輯，但經(jīng)過不斷“溝通”調(diào)整后，賈維斯能夠分辨差異，并根據(jù)每個(gè)人聽音樂的喜好與模式推薦歌曲。扎克伯格認(rèn)為，當(dāng) AI 助手懂得愈多語意脈絡(luò)，愈能處理各種開放式、非特定而慣用的指令，而賈維斯也在這樣的“訓(xùn)練”下，表現(xiàn)愈來愈進(jìn)步。

具備視覺與臉部辨識(shí)功能

為了讓賈維斯擁有視覺與臉部辨識(shí)能力，扎克伯格在家門口設(shè)備數(shù)臺(tái)攝影機(jī)，讓賈維斯能以多個(gè)角度取得訪客樣貌長(zhǎng)相，并透過臉部辨識(shí)技術(shù)加以識(shí)別訪客身份。一旦確認(rèn)對(duì)方身份是預(yù)期到訪的客人，賈維斯就會(huì)讓對(duì)方進(jìn)門，同時(shí)知會(huì)扎克伯格。

除此之外，視覺與臉部辨識(shí)功能還能應(yīng)用在許多方面，例如掌握女兒 Max 的動(dòng)態(tài)，或是偵測(cè)每個(gè)人的所在位置，借以判斷應(yīng)在哪個(gè)房間、哪個(gè)位置執(zhí)行指令。

溝通靠文字和語音信息、聲控功能

扎克伯格運(yùn)用自家 Messenger 架構(gòu)打造聊天機(jī)器人平臺(tái)，以便隨時(shí)隨地透過手機(jī)傳送文字或語音信息跟賈維斯溝通；賈維斯也會(huì)利用平臺(tái)提醒扎克伯格待辦事項(xiàng)，或傳送訪客影像給扎克伯格，告訴他哪位客人來訪等等。

扎克伯格跟賈維斯溝通的方式以文字信息居多，連他自己也感到相當(dāng)驚訝。他認(rèn)為主要原因是文字信息的干擾性較低，也能等自己想看時(shí)再看，不受語音信息限制。這其實(shí)也符合 Messenger 和 Whatsapp 等通訊軟件的使用者偏好，也就是慣用文字信息多于語音信息。扎克伯格表示，未來的 AI 產(chǎn)品不能只著重在語音聲控，還必須具備文字信息界面。

當(dāng)然，扎克伯格并不表示聲控和語音辨識(shí)功能不重要。他為此還開發(fā)出聲控專用 app，載入手機(jī)之后便能直接以語音操控賈維斯。

持續(xù)改良賈維斯，配音人選將揭曉

這一年來，扎克伯格利用閑暇時(shí)間打造賈維斯，總共耗時(shí)約 100 小時(shí)。他認(rèn)為透過這次挑戰(zhàn)所學(xué)習(xí)到的事物遠(yuǎn)遠(yuǎn)超出預(yù)期，對(duì)自家工程師所使用的內(nèi)部技術(shù)也更有概念。扎克伯格對(duì)于 Facebook 程序碼數(shù)據(jù)庫及各種內(nèi)部工具感到相當(dāng)滿意，也因?yàn)檫@些資源，為開發(fā)賈維斯節(jié)省了不少時(shí)間。

雖然目前已成功打造出賈維斯，扎克伯格坦言還是有許多地方有待改善，接下來會(huì)想辦法教賈維斯自行學(xué)習(xí)新技能，而不是教他執(zhí)行特定任務(wù)。

扎克伯格未透露賈維斯配音人選，僅表示即將揭曉

扎克伯格即將在明年初分享新年新挑戰(zhàn)，至于先前網(wǎng)友們熱烈討論的賈維斯配音人選問題，他則是賣關(guān)子表示，賈維斯的“真聲”即將會(huì)在接下來發(fā)布的影片中揭曉。

鋼鐵俠扮演者羅伯特·唐尼（Robert Downey）曾經(jīng)表示愿意在特定情況下為賈維斯配音。但扎克伯格還是將決定權(quán)交給公眾。他的Facebook帖子共收到5萬多條評(píng)論，根據(jù)大眾的投票，賈維斯很有可能使用美國影星摩根·弗里曼（Morgan Freeman）的聲音。

扎克伯格表示，他給弗里曼打電話說：“嘿，我發(fā)了這樣一個(gè)帖子，有好幾千人想讓你來配音。你愿意嗎？”弗里德曼回答道：“當(dāng)然愿意。”

摩根·弗里曼曾在電影《冒牌天神》中飾演上帝

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

扎克伯格实现今年“小目标”：成功打造AI语音助手J.A.R.V.I.S.

日期： 2016-12-22

相關(guān)內(nèi)容