《電子技術應用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 菲爾茨獎得主:頂級 AI 缺少了什么?

菲爾茨獎得主:頂級 AI 缺少了什么?

2019-04-23

  人工智能的列車高速向前,模擬一個人腦、讓計算機產生“意識”的可能性似乎比以前大了一點點。意識是什么、機器是否可能擁有意識,也就成了計算機科學家、神經科學家、數(shù)學家、哲學家越來越多探討的課題,其中就包括1974年菲爾茨獎得主大衛(wèi)·芒福德(David Mumford)教授。

  芒福德教授是早年哈佛的數(shù)學系擔當,學術生涯起步于純數(shù)學(代數(shù)曲線),隨后將主要精力轉向與計算機科學密切相關的應用數(shù)學。此外,他還熟悉物理、神經科學等領域,這篇文章就是他在綜合學科背景下對于機器意識問題的思考。歡迎來稿討論、交流與商榷。

  人工智能的機器可能有意識嗎?

  撰文 | 大衛(wèi)·芒福德(David Mumford)

  人工智能理論在我的人生里已經經歷了六七個繁榮和蕭條的輪回,有些時期人們信心滿滿地說計算機的智能很快就會達到人類水平,有些時期只有幻滅,似乎這是永遠做不到的。在今天,我們正在最新的一輪繁榮之中,一些有遠見的計算機科學家甚至更進一步,探問AI(這個縮寫聽起來就像新的生物形態(tài))除了能達到人類的智能水平以外,是否還能擁有像我們這樣的意識。還有些未來學家考慮的是一場更奇異瘋狂、能改變生活的繁榮:我能不能將大腦和意識下載到硅片上,就此獲得永生,也就是說人能不能變形為AI?

  在上一次輪回的繁榮時期中,當時的瘋狂預言是我們正在走向“奇點”,就是超級AI會創(chuàng)造一個全新世界的時間點,這會導致人類種族被取代而滅絕(預計會發(fā)生在2050年前后)。我承認在上半生曾經希望見證計算機第一次獲得意識的那一刻,但現(xiàn)在我對此越發(fā)懷疑。也許這就是老人的消極看法,但可能也是因為我并不認為這個問題只跟計算機科學有關,而是同樣關乎生物學、物理學、哲學,對了還有宗教。誰又有這樣的專業(yè)知識來推算所有這些東西如何影響我們對意識的理解?

  即使是談論宗教對科學進步的任何影響,對于今天的知識分子來說都是要被逐出圈子的。但考慮一下這個問題:是否存在這樣的信仰體系,其中人類很快就能永生的硅谷之夢與“靈魂不滅”的基督信條同時成立?對我來說,這兩種信念似乎處于不同的宇宙,并不沖突。

  頂級 AI 缺少了什么?

  我先評述一下當前的AI熱潮,還有為什么它即使目前大獲成功,仍然終將走向破滅。在支撐新AI的代碼中,最關鍵的角色是被稱為“神經網(wǎng)絡”的算法。然而,每個網(wǎng)絡都有海量的被稱為“權重”的參數(shù)需要先設定好,神經網(wǎng)絡才能工作。要進行設定,我們就得用現(xiàn)實生活的數(shù)據(jù)集來“訓練”這個網(wǎng)絡,用的是另一個叫做“反向傳播”的算法。由此得到的神經網(wǎng)絡在得到一系列代表某種觀察結果的數(shù)值作為輸入之后,會輸出給這串數(shù)據(jù)打上的一個標簽。比如說,它可以將某個人面部圖像的像素值表達作為輸入,然后輸出它對這個人性別的猜測。要訓練這樣的一個網(wǎng)絡,需要向它灌輸成千上萬正確標注性別的人臉,然后逐步調整權重,使它作出的預測越來越準確。

  神經網(wǎng)絡是受大腦皮層真實回路的簡化版啟發(fā)而來的一種簡單設計,它可以追溯到1934年麥卡洛克(McCulloch)和皮茨(Pitts)的一篇經典論文。而更重要的是在1974年,保羅·維博斯(Paul Werbos)在撰寫博士論文時引入了反向傳播,用以優(yōu)化不計其數(shù)的權重,令它們能更好地處理一系列的輸入,比如說人工標注過的數(shù)據(jù)集。

  人們玩這個已經玩了40年,由楊立昆(Yan LeCun)等人推廣,也取得了一些成效。但統(tǒng)計學家很懷疑它能否解決那些困難的問題,原因是所謂的偏差-方差權衡(bias-variance trade-off)。他們說,必須將算法訓練用到的數(shù)據(jù)集大小與待學習的權重數(shù)量進行比較:如果權重數(shù)量不夠,那么不可能對復雜的數(shù)據(jù)集進行精確建模;如果權重數(shù)量足夠,那么就會對數(shù)據(jù)集獨有的性質建模,而這些性質不會在新的數(shù)據(jù)上體現(xiàn)。那么現(xiàn)實中發(fā)生了什么?計算機速度極大提高,能訓練擁有海量權重的神經網(wǎng)絡,而數(shù)據(jù)集因為互聯(lián)網(wǎng)的出現(xiàn)而變得越發(fā)龐大。

  可謂天機玄妙,與統(tǒng)計學家的預測背道而馳的是,神經網(wǎng)絡算法效果非常好,以某種方式神奇地回避了偏差-方差問題。我認為可以說沒有人知道神經網(wǎng)絡避免這個問題的方式或者原因。這是對理論統(tǒng)計學家的挑戰(zhàn)。但人們用神經網(wǎng)絡構建了各種具有實際意義的應用,比如說視覺、語音、語言的處理,醫(yī)學診斷,還有游戲博弈,這些應用此前都被認為非常難以建模。最后是公關上的畫龍點睛:神經網(wǎng)絡的訓練現(xiàn)在改稱為“深度學習”。這樣一來,誰又會懷疑AI的美麗新世界已經到來呢?

  但是還有一座高峰需要攀登。在此前題為《語法并不只是語言的一部分》(Grammar isn‘t merely part of language)的文章中,我討論了一種信念:所有形式的思考都需要語法。這意味著你的心靈會在世界中發(fā)現(xiàn)一些重復出現(xiàn)但不一定完全相同的模式。這些模式可以是物體外觀的視覺排列,比如說處于同一直線上的點,或者人臉上眼睛的位置;也可以是言談中的詞語或者是簡單的動作,比如說開車踩油門;甚至可以是抽象概念,比如說“忠誠”。不管帶有模式的是哪一種觀察結果或者思想,你會預計它重復出現(xiàn),可以用來理解新的情景。作為成年人,我們思想中所有事物的構建都來自學到的可重復利用的模式,它們組成了一個層級結構,而情景、時間、計劃或者思想,都可以用一棵由這些模式組成的“語法分析樹”來表示。

  但問題在于,最基本形式的神經網(wǎng)絡并不能找到新的模式。它的運作就像黑箱,除了給輸入貼標簽以外什么都做不到,比如說不能告訴你“這個圖像看上去有一張人臉”。在發(fā)現(xiàn)人臉的過程中,它也不會說:“我首先找到了眼睛,這樣我就知道這張臉的其他部分應該在什么地方了?!彼粫嬖V你它得出的結論。我們需要能輸出如下結果的算法:“我在絕大部分數(shù)據(jù)中找到了這樣的模式,來給它起個名字吧?!边@樣它能輸出的就不止是一個標簽,還有對輸入數(shù)據(jù)組成部分的分析。

  跟這個愿景相關的是,我們可以閉上眼睛,想象一輛汽車的樣子,上面有輪子、車門、引擎蓋等等,利用這個我們就能將新數(shù)據(jù)組合起來。這就像是逆向運行一個神經網(wǎng)絡,對每個輸出標簽都能產生對應的新輸入數(shù)據(jù)。人們正在嘗試改進神經網(wǎng)絡來做到這一點,但現(xiàn)在效果仍未盡如人意。我們仍不知道這座高峰有多難攀登,但我覺得這個問題不解決,人工智能就無法靠近人類智能。

  如果人工智能的目的是展示人類水平的智能,那么我們最好先定義人類智能到底是什么。心理學家當然在定義人類智能上花了大功夫。長久以來有個很流行的想法,也就是人類智能可以用一個度量——也就是智商——來完全確定。但是,智能的意思是不是說能解開電視節(jié)目《危險邊緣》(Jeopardy?。┲械闹i題?還是能記住人生中更多事件的更多細節(jié)?或者是以高超技巧譜曲或者繪畫?這些當然都是,但細想一下:什么是我們人類擅長并占據(jù)了我們大部分日常思考的事?應該是猜測另一位人類同胞有什么感受、目標和感情。更進一步的,什么才能影響這個人的感情和目標,使得我們可以與之協(xié)作、達成我們的目標?許多時候,這就是決定你人生是否成功的技能。

  計算機科學家的確考慮過為其他客體的知識和計劃建模的這項需要。一個有名的例子就是,想象有兩位將軍A和B,他們在兩座面對面的山頂上,需要同時攻擊山谷處的敵人,但他們之間的通訊只能穿過敵方陣線進行。A給B發(fā)了個信息:“明天出擊?” B回答:“可以?!钡獴不知道自己的回復有沒有到達,而A必須給B發(fā)送另外一道信息來確認已經收到了B之前的信息,為的是確保B會行動。為此需要發(fā)送更多的信息(實際上,要達到完全的共識,他們需要發(fā)送無窮無盡的信息)。

  計算機科學家很清楚我們需要向AI賦予新的能力,使它能維護并構建各種模型,描述周遭其他客體的知識、目標與計劃。這種能力必須包括知道自身知道什么不知道什么。但某種程度上來說,以目前的編程水平還是做得到這些的。

  我們需要情緒#$@*&!

  然而這個博弈論的世界缺少了人類思考的關鍵要素之一:情緒。沒有情緒,就永遠不可能和人類搞好關系。我覺得奇怪的是,就我所知,只有一位計算機科學家為情緒建模做過努力,那就是麻省理工學院媒體實驗室的羅莎琳德·皮卡德(Rosalind Picard)。即使是對人類情緒總體的科學研究,似乎也陷于停滯,大體上被許多學科所忽視。比如弗蘭斯·德瓦爾(Frans de Waal)在討論動物情緒的新書《Mama的最后一次擁抱》(Mama‘s Last Hug)中對人類和動物的情緒就有這樣的說法:

  我們給不少情緒命了名,描述了它們的表達方式,記錄了它們會出現(xiàn)的各種情況,但還缺少一個框架,用來定義這些情緒并探索它們帶來的好處。

 ?。ㄟ@是不是因為有很多從事科學和數(shù)學工作的人都有自閉癥譜系障礙?)有一位心理學家明確指出了情緒在人類智能中扮演的角色。霍華德·加德納(Howard Gardner)的經典著作《智能的結構》(Frames of Mind: The Theory of Multiple Intelligences)中就引入了“人際智能”(主要是理解他人的情緒)和“自我認知智能”(理解自身)的概念,與其他能力并列。這些能力現(xiàn)在被心理學家稱為“情緒智能”,但正如德瓦爾所言,精確定義的缺失給它的研究蒙上了一層陰影。最近維基百科的“情緒智能”頁面上的“定義”如下:

  情緒智能可以被定義為監(jiān)測自身以及他人情緒、區(qū)分不同情緒并正確分類、利用有關情緒的信息……來加強對人際互動的思考與理解的能力。

  區(qū)分情緒狀態(tài)最古老的嘗試可以追溯到希波克拉底(Hippocrates)的四體液說(the Four Humors):四種體液關聯(lián)著四種不同的人格特征和對應的特有情緒。它們是多血質(主動、善于社交、隨和)、膽汁質(意志堅定、支配他人、易怒)、黏液質(被動、避免沖突、平靜)和抑郁質(憂郁、深思、可能焦慮)。它們被兩根軸線分隔。第一根軸是外向與內向的對立,在經典著作中也叫熱與寒的對立,其中多血質和膽汁質屬于外向,而黏液質和抑郁質屬于內向。第二根軸是放松與拼搏的對立,在經典著作中也叫濕與干的對立,多血質和黏液質屬于放松,而膽汁質和抑郁質屬于拼搏。

  在近代,漢斯·艾森克(Hans Eysenck)發(fā)展了這套分類方法,他的版本(畫得五彩斑斕)在這里:

5cbd768973bba-thumb.jpg

  現(xiàn)代對情緒的研究可以追溯到達爾文(Darwin)的著作《人和動物的感情表達》(The Expression of the Emotions in Man and Animals),其中他利用伴隨情緒的表情來進行情緒分類。保羅·??寺≒aul Ekman)延伸并嚴謹化了達爾文的理論,導出的理論有六種基本情緒,每種都有獨特的面部表情:憤怒、恐懼、高興、悲傷、驚訝和厭惡。還有許多次級情緒,由強度不同的基本情緒組合而來。

  羅伯特·普拉奇克(Robert Plutchik)將基本情緒擴充為八種,為各種情緒較弱和較強的變種命名,得到了這個驚人而多彩的圖表。實際上,有無窮無盡的次級情緒,比如羞恥、愧疚、感恩、寬恕、報復心、自傲、羨慕、信任、希望、后悔、孤獨、挫敗感、激動、尷尬、失望等等,它們并非基本情緒的簡單混合,而是掛接到多個客體與因素混雜的社交情景上的情緒。

  弗蘭斯·德瓦爾在他的書(第85頁)中參照上面這個列表作出了情緒的如下定義:

  情緒是外部刺激給機體帶來的一種臨時狀態(tài),標志是軀體和心智中特定的轉變——大腦、激素、肌肉、器官、心臟、警覺水平等。通過機體自身所在的情景及它在行為上的變化和表現(xiàn),可以推知被觸發(fā)的情緒。

  雅克·潘克塞普(Jaak Panksepp)開拓了另一條相當不同的探索途徑,參看他與露西·比文(Lucy Biven)的著作《心靈考古學:人類情緒的神經進化論起源》(The Archeology of Mind: Neuroevolutionary Origins of Human Emotions)。他的研究方向并不是以面部表情為出發(fā)點,而更靠近希臘的體液學說。潘克塞普長期以來都在尋找大腦活動中的模式,特別關注皮質下結構的活動及其向更高級腦區(qū)傳遞的神經遞質,這些都會導致不同的當下情感狀態(tài)以及對應的行為模式。他們的情緒列表跟達爾文的相當不同,盡管也有重疊。他們辨認出了七種主要情感狀態(tài):(一)尋求/探索;(二)憤怒;(三)恐懼/焦慮;(四)關懷/愛;(五)悲傷/苦惱;(六)玩樂/高興;(七)色欲。

5cbd768960c3a-thumb.jpg

  順便說一句:我不清楚為什么他沒有加上第八種情感狀態(tài):痛苦。即使我們通常不說痛苦是情緒,但它的確是心智中源于皮層下結構的一種情感狀態(tài),一種引起厭惡的獨特感受,會觸發(fā)特定的行為,也會導致特定的面部表情和軀體反應。在書中第十一章,兩位作者走得更遠,提出中腦的一個特定腦區(qū),也就是導水管周圍灰質(也許還有它旁邊的腹側被蓋區(qū)和中腦自主活動區(qū)),它協(xié)調了上述所有情感狀態(tài),產生了他們所謂的核心自我(core self),或者說意識。難怪德瓦爾會說目前還沒有關于情緒狀態(tài)的明確框架。

  建立一個能用于人工智能代碼的合適理論,需要的可能就是從海量數(shù)據(jù)出發(fā),這也是神經網(wǎng)絡解開語音和視覺領域眾多結構的關鍵。我們的目標是定義這樣的三向關連:(一)大腦活動(特別是杏仁核及其他皮層下腦區(qū),但也包括大腦皮層中的島葉和扣帶回);(二)軀體反應,其中包括激素、心跳(威廉·詹姆斯(William James)強調它是情緒的核心標志)以及面部表情;(三)社交情景,包括此前和將來的活動。情緒狀態(tài)應該由這樣的一堆三元組所定義——在某種類型的社交情景中產生的某種類型的神經與軀體反應。

  我們一開始可以先從志愿者那里收集大量數(shù)據(jù),方法是給他們插上靜脈導管,讓他們一邊通過耳機聽小說,一邊進行核磁共振成像。一位心理學的同事提醒我,他的博士生要在凌晨核磁共振儀空閑時在機器圓筒里度過許許多多個小時。跟所有聚類算法一樣,這種努力的結果不一定是一組明確區(qū)分的情緒,而更可能是一種稍顯模糊的分類,分類中還有許多變體。

  所有人類似乎都能在同一位朋友身上認出幾乎相同的基本和次級情緒,而人工智能也需要能夠做到這一點。沒有情緒分析的話,計算機科學家在給機器人編程就會出錯,無法使之能在與人類互動時正確模仿并回應情緒,我們把這種至關重要的能力叫做人工共情(artificial empathy)。我甚至承認,如果我們希望AI真正擁有意識,我相信它必須在某種意義上擁有自己的情緒。探索意識與情緒之間聯(lián)系的一個好辦法,就是看看對于非人類的動物我們知道些什么。

  動物中的意識

  我想指出的是,如果想探索AI能不能獲得意識,我們應該先回答動物有沒有意識。先讓我給所有正在讀這篇文章的人說一句開場白:這位朋友,我相信你是有意識的。除了那些別扭的唯我論者,我們都承認,在每位人類同胞的腦袋里都有意識棲居,而且跟我們自己的意識沒什么區(qū)別。但現(xiàn)實是,除了我們的共情以外,并沒有證據(jù)支持這一點。所以我們是否應該利用共情,將意識的信念延伸到動物上?

  可以說,有貓狗之類寵物的人絕對會認定寵物有意識。為什么?因為他們在寵物身上看到了某些行為,可以直接被理解為某種類似于他們也擁有的情緒導致的結果。他們覺得動物行為學的研究者將動物“感到恐懼”說成“展示了對捕食者的回避行為”荒謬絕倫。他們不覺得說寵物“感到恐懼”是一種擬人化,反而覺得是常識,并且相信他們的寵物除了感受以外還擁有意識。

  我們談論這些問題時用到的語言沒多大用處??紤]下面一系列詞語:情緒、感受、覺知、意識;還有這些短語:我們“感受到情緒”“覺知到自己的感受”“擁有意識覺知”,這些短語連接了之前那一串中前后相繼的詞語。換句話說,語言將所有這些概念連接在了一起,讓人思考的時候容易不夠清晰。同樣需要注意的是,在這個信息時代,許多老年病人的陪伴者是相當原始的機器人,或者是屏幕上的頭像,但這些病人很容易誤認這些信息造物有真正的感情。

  所以我們傾向于說,我們單純就是不清楚非人類的動物有沒有感受或者意識。或者我們也可以兩頭下注,承認它們擁有感受,但將界線劃在意識上。無論如何,至少一位神經科學家,也就是雅克·潘克塞普,嘲諷這種立場是不可知論癥末期。這個問題本該有個答案,但這種立場終結了討論。

  直到最近,情緒和意識才獲得了作為科學研究合理課題的地位。最近幾十年,通過堅持不懈的觀察和測試,人們對動物情緒的研究達到了驚人的細致。此前提到的弗蘭斯·德瓦爾和雅克·潘克塞普各自的書中,都細致描述了種類繁多的情緒行為,橫跨從黑猩猩到大鼠的諸多物種,其中不僅有基本情緒,還有之前談到的某些次級情緒(比如說黑猩猩和狗的羞愧和驕傲情緒)。潘克塞普指出,大鼠幼崽也怕癢,在撓它們的腹部時,也會做出類似人類嬰兒的反應(見前述書籍第367頁)。

  對我來說,這些著作以及其他文獻,當然還有我自己養(yǎng)狗養(yǎng)豬養(yǎng)馬的粗淺經歷,再加上在動物園看的動物,這些都是動物情緒令人信服的佐證。因為所有哺乳動物大腦內結構之間都有詳實的同源證據(jù),我看不到有什么理由去懷疑所有哺乳動物都能體驗跟我們一樣的那些基本情緒,即使它們的次級情緒遠沒有我們豐富。而且,如果我們和動物都有情緒,正如我們會認為人類同胞有意識,出于同樣的理由我們也可以認為動物有意識。這就是“奧卡姆剃刀”(Occam’s Razor)的完美實例:這是目前為止解釋觀察數(shù)據(jù)最簡單的辦法。

5cbd7689322c5-thumb.jpg

  除了哺乳動物,審視生命之樹其他部分是否有可能有意識也對我們很有幫助,無論那些物種是今日尚存還是從化石構建而來。啟發(fā)我這一點的,是哲學家與潛水員彼得·戈弗雷-史密斯(Peter Godfrey-Smith)的著作《章魚、心智、演化:探尋大海及意識的起源》(Other Minds: the Octopus, the Sea and the Deep Origins of Consciousness)。

  在生命之樹的基干上有兩個表面上相似的界:細菌界與古菌界。它們都是原核生物,由簡單的細胞組成,沒有細胞核、線粒體、核糖體和其他細胞器。另一方面,兩者都擁有來自主要蛋白質家族的蛋白質,使用了通用遺傳密碼(由同一組轉運RNA分子實現(xiàn)),還有令人矚目的一點是,它們用于合成作為能量之源的三磷酸腺苷(ATP)的復雜電化學機制與所有高等生命一致。這個機制利用了離子泵將細胞內膜轉化為電容,這也是高等動物神經系統(tǒng)中信息傳遞的關鍵機制(在尼克·萊恩(Nick Lane)的著作《生命之源》(The Vital Question)中有生動的描述)。這些形式最簡單的生命也能通過細胞膜上的通道來感知周遭的化學環(huán)境,而絕大部分也能利用鞭毛四處移動,就此作出反應,尋求更好的環(huán)境。

  這就是開端,一種原始形式的知覺,在35億年前出現(xiàn)。盡管我個人在此更傾向于不可知論立場,但在這些細胞中完全有可能存在意識的毫末。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。