隨著人工智能發(fā)展如火如荼,人們在驚嘆于它所取得的巨大進步的同時,對人工智能的期望也在不斷提高,并逐漸發(fā)現(xiàn)它的一些不足,比如不夠魯棒(Robust),小數(shù)據(jù)的學(xué)習(xí)能力不強,缺少常識,缺少可解釋性等等。
筆者之前看了明斯基的《情感機器》一書,由此又找到了明斯基關(guān)于這本書的一篇討論文章(根據(jù)他在2007年對該書的一次講演整理而成),讀到了更多的背景,感覺很受啟發(fā)。明斯基是人工智能研究的奠基人之一,被稱為人工智能之父,人工智能的不少方法都來源于他。在這篇文章里,明斯基列出了當時人工智能領(lǐng)域的各種方法,也就人工智能在當時為何仍然如此受限提出了自己的看法。他認為根本問題在于幾乎所有的研究者都只想著用單一的方法去實現(xiàn)人工智能這樣一個非常復(fù)雜的系統(tǒng)。
明斯基:單一方法的局限性
來源:The Emotion Machine: Commonsense Thinking, Artificial Intelligence, and the Future of the Human Mind,Marvin Minsky
背景信息
馬文·明斯基,人工智能框架理論的創(chuàng)立者,被譽為“人工智能之父”。和麥卡錫(J.McCarthy)一起在1956年發(fā)起“達特茅斯會議”并提出人工智能(Artificial Intelligence)概念,于1969年被授予圖靈獎。他是第一位獲此殊榮的人工智能學(xué)者,代表作包括《情感機器》、《心智社會》等。
從人工智能發(fā)展的歷史來看,我非常認同明斯基的這個觀點,單一方法很難徹底解決人工智能這樣一個復(fù)雜的問題。最為主流的兩種方法,不論是符號方法還是統(tǒng)計方法,都在快速發(fā)展一段時間后遇到瓶頸,而且試圖使用單一方法解決這些瓶頸問題的嘗試目前都未取得好的成果。
二十多年前在上海交大攻讀自然語言處理方向的博士時期,我就意識到混合多種方法的必要性,所以把博士論文題目定為《基于混合方法的自然語言處理》。當時正是統(tǒng)計方法被用于自然語言處理的初期,不過我也能感覺到這種基于數(shù)據(jù)的方法對于處理比較細微的語言現(xiàn)象應(yīng)該會有不足的地方。當時也是根據(jù)自己比較樸素的直覺來判斷的。最近看了明斯基的分析,感覺更是心有戚戚焉。按照他的分析,未來需要各種方法相結(jié)合的人工智能系統(tǒng),我認為這也是未來人工智能取得進一步突破的重要途徑。近幾年英特爾中國研究院在自適應(yīng)機器人交互方面的研究也是沿著多種方法結(jié)合的路徑在走,感覺還是很有成效的。
可能有人會問,多種方法結(jié)合并不是一個新鮮課題,過去已有不少這方面的研究,比如多模態(tài)融合就是研究各種模態(tài)融合的方法,包括特征級別的早期融合(Early fusion),或是分類器輸出之后再做融合的晚期融合(Late fusion)等方法。不過它們和本文所指的多種方法融合還是有很大的差別,因為多模態(tài)融合里的多個分類器實際上只是一種同質(zhì)的方法,比如都是某種統(tǒng)計學(xué)習(xí)分類器,那么這種結(jié)合可能還是存在較大的局限。所以,所謂多種方法結(jié)合其實應(yīng)該是更異質(zhì)的多種方法的結(jié)合,比如符號方法和統(tǒng)計方法相結(jié)合等。
明斯基在《情感機器》這本書中列出了他對未來人工智能系統(tǒng)的一些設(shè)計,其中比較有意思的是“批評家-選擇器結(jié)構(gòu)”。在多種方法結(jié)合的人工智能系統(tǒng)中,對同一個事物的判斷可能有多種不同方法可以給出結(jié)果,那么到底選用哪個方法的結(jié)論呢?這里將每個單一方法看作是一個批評家,而選擇器能夠選取當前最適合的批評家。那么具體而言,這個選擇器該如何實現(xiàn)呢,它又如何知道在目前的情境下應(yīng)選用哪個方法呢?對于這一點,書中并沒有非常具體的介紹,但我認為它提到的“自我反省”非常重要,有了自我反省就能知道系統(tǒng)有什么不足,就能不斷進行改進,也就具備了連續(xù)學(xué)習(xí)的能力。這種能夠自我反省、連續(xù)學(xué)習(xí)的系統(tǒng)很有可能可以解決現(xiàn)在人工智能的不少問題,包括魯棒性,可解釋性等。
大致的方向確定了,接下來該如何開發(fā)更先進的人工智能?
首先,要改變研究思路。未來基于單一方法的研究一定還會長期存在,畢竟這個是基礎(chǔ)。但可能更需要一批對多種人工智能方法結(jié)合的系統(tǒng)感興趣的研究人員。根據(jù)明斯基在另一次訪談中的說法,研究思路轉(zhuǎn)變了以后,人工智能的進展速度會是以月來計的,而不是現(xiàn)在的幾年到十年。從人工智能各個領(lǐng)域的研究歷史來看,確實有不少時期內(nèi)研究進展比較緩慢,不少研究只是在做一些小修小補。也許現(xiàn)在已是我們不得不做出改變的時候了,與其重復(fù)一些價值不大的研究,不如另起爐灶嘗試可能做出突破性成果的新領(lǐng)域。
混合多種異質(zhì)方法的下一代人工智能系統(tǒng)必將是一個等待廣大有志于人工智能研究的科研人員去挖掘的巨大金礦。這樣的研究無疑對研究者個人和團隊的綜合能力提出了更高的要求。過去的人工智能研究,基本上都是按子領(lǐng)域劃分的,比如機器學(xué)習(xí)、計算機視覺、自然語言處理、語音識別等。未來可能會需要更多不同領(lǐng)域的專家共同合作,甚至?xí)枰苄偷腁I人才。這些人才需要在人工智能的多個子領(lǐng)域都是專家,并且對各方面都有廣泛的涉獵。
目前是人工智能研究的一個很好的時代,不少領(lǐng)域在飛速發(fā)展,打下了良好的基礎(chǔ),使得大家可以專注于更具挑戰(zhàn)性的問題。希望這些由明斯基引發(fā)的一系列討論能給大家?guī)韱l(fā),未來還有更多未知領(lǐng)域等待我們?nèi)ヌ剿??!奥仿湫捱h兮,吾將上下而求索”,與大家共勉,一起探索未來的人工智能。
參考文獻
1. The Emotion Machine: Commonsense Thinking, Artificial Intelligence, and the Future of the Human Mind,Marvin Minsky, http://www.terasemjournals.com/PCJournal/PC0303/mm3.html
2. 情感機器, (美) 馬文·明斯基 (Marvin Minsky)著,王文革,程玉婷,李小剛譯