《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 為什么人工智能還遠(yuǎn)不能取代人類 語言理解能力仍然欠缺

為什么人工智能還遠(yuǎn)不能取代人類 語言理解能力仍然欠缺

2016-05-11
關(guān)鍵詞: 人工智能 人類 語言 機器人

4jRw-fxryhhh1845098.jpeg

  和許多新生事物一樣,人工智能(AI)近期的發(fā)展同樣經(jīng)歷了一些起伏和波折。在前不久舉行的一場被廣泛認(rèn)為是人工智能領(lǐng)域里程碑事件的人機對弈比賽中,人工智能取得了對人類前世界冠軍的勝利。然而也就在一周之前,在國外社交網(wǎng)站推特上一個旨在通過與真實的人類進(jìn)行對話并能夠從中學(xué)習(xí)的“聊天機器人”卻因為網(wǎng)民們的惡意調(diào)侃而迅速“學(xué)壞”,很快變得滿嘴污言穢語,還充斥著種族主義思想,以至測試方只能趕忙將它下線處理。

  這些事情究竟是如何發(fā)生的?它們對于迅速發(fā)展中的人工智能領(lǐng)域研究將產(chǎn)生什么樣的作用?

  在今年3月初,由谷歌公司設(shè)計的圍棋對弈系統(tǒng)“阿爾法狗”擊敗了韓國的前圍棋世界冠軍李世石。圍棋對弈的復(fù)雜性被認(rèn)為遠(yuǎn)超國際象棋,因此在此之前常常被研究人員用來評估人工智能能夠達(dá)到的水平高度。而在谷歌的“阿爾法狗”亮相之前,大部分專家都認(rèn)為人工智能如果想要在圍棋領(lǐng)域擊敗人類頂尖水平選手恐怕還需要數(shù)十年時間的發(fā)展。

  但就在這場里程碑式的勝利之后不久,微軟公司推出了一款名為“Tay”的推特線上聊天機器人,其設(shè)計能夠模仿一名19歲的美國少女。推特用戶可以與Tay在線聊天,微軟公司表示Tay能夠通過這樣的對話學(xué)習(xí)真實人類的說話方式并不斷完善自己,并更好地與人類交流。但就在Tay上線之后僅僅16小時之后,微軟就不得不將其緊急下線處理,因為這款聊天機器人開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句。在緊急下線之后微軟公司很快就此事向公眾表達(dá)了歉意,同時指責(zé)這一事件是一次“針對這一技術(shù)探索項目”的“薄弱點”所開展的“有組織的攻擊”。

  不過盡管微軟公司將這一令人失望的狀況歸結(jié)為黑客攻擊行為。但人工智能專家,美國康奈爾大學(xué)的計算機科學(xué)教授巴特·賽爾曼(Bart Selman)博士則認(rèn)為,微軟所稱的這種所謂“技術(shù)薄弱點”似乎更像是一種過濾機制的缺陷,那就是Tay往往傾向于直接獲取別人對她說過的詞匯并為自己所用,而在此過程中并不加以適當(dāng)?shù)倪^濾。賽爾曼博士表示,他對此感到非常驚訝,因為微軟竟然沒有建立足夠有效的安全措施來防止此類事件的發(fā)生,但他也表示,這一事件凸顯了人工智能領(lǐng)域目前所面臨的一大弱點:語言能力。

  教授AI

  賽爾曼博士表示,人工智能非常擅長句子解構(gòu),它們能夠找出隱藏在文字背后的語法模式。這種能力讓Tay這樣的聊天機器人能夠創(chuàng)建出一種符合人類語言語法習(xí)慣的句子。這種能力也正是谷歌和Skype軟件翻譯功能背后的技術(shù)基礎(chǔ)。但是賽爾曼同時也指出:“但說到對于語句意義的理解就是另外一回事了?!?/p>

  近幾年來人工智能的迅速發(fā)展在很大程度上得益于一種被稱之為“深度學(xué)習(xí)”的技術(shù)的進(jìn)步,這項技術(shù)可以說在某些地方模仿了人類大腦內(nèi)神經(jīng)系統(tǒng)的運作模式。當(dāng)輸入海量信息時,它非常擅長從中找出某種模式,這也解釋了為何人工智能領(lǐng)域近幾年來一些最成功的突破都發(fā)生在知覺任務(wù)領(lǐng)域,如圖像或語音識別等方面。

  英國牛津大學(xué)計算機科學(xué)系助理教授西蒙·威特森(Shimon Whiteson)指出,傳統(tǒng)技術(shù)方法中,研究者必須“告訴”人工智能去看什么,它們才能去學(xué)習(xí)。而相比之下,深度學(xué)習(xí)的優(yōu)勢就在于這類系統(tǒng)能夠自動發(fā)現(xiàn)其中的模式。

  人工智能的決策網(wǎng)絡(luò)第一層被設(shè)計用于在數(shù)據(jù)中識別一些最基本的模式,比如圖像中某個物體的邊界。隨后這一結(jié)果被輸入到第二層決策網(wǎng)絡(luò),后者將繼續(xù)搜尋更為復(fù)雜的模式,如方形或者圓形。這一過程不斷遞進(jìn)迭代,每一層決策網(wǎng)絡(luò)都能夠識別比上一層更加復(fù)雜的模式,于是隨著時間推移,人工智能的模式識別能力不斷提升,比如它能夠借助低層次決策網(wǎng)絡(luò)得到的機構(gòu)外觀信息最終準(zhǔn)確地鑒別出一些物體,如一輛汽車或是一輛自行車。

  威特森表示:“借助深度學(xué)習(xí)技術(shù),你能夠?qū)⒑A繑?shù)據(jù)輸入一個大型神經(jīng)網(wǎng)絡(luò),然后它自己就能完成從頭到尾的自我訓(xùn)練?!?/p>

  巨大的回報

  這一技術(shù)的發(fā)展已經(jīng)產(chǎn)生了一些擁有超人般能力的人工智能。賽爾曼表示深度學(xué)習(xí)系統(tǒng)已經(jīng)被證明能夠在醫(yī)學(xué)核磁共振影像判讀方面超越人類專家。另外還有一種技術(shù)被稱為“增強學(xué)習(xí)”(reinforcement learning),該技術(shù)主要原理是機器通過獎勵信號來不斷修正自己的最優(yōu)策略并不斷進(jìn)步的技術(shù)方法。加拿大人工智能初創(chuàng)公司“Maluuba”的首席技術(shù)官兼聯(lián)合創(chuàng)始人卡希爾·蘇勒曼(Kaheer Suleman)表示,當(dāng)將深度學(xué)習(xí)與增強學(xué)習(xí)兩者相結(jié)合,機器還能夠進(jìn)行精確的虛擬仿真。谷歌公司的人工智能系統(tǒng)“阿爾法狗”正是通過自己與自己對弈超過數(shù)百萬局,并不斷總結(jié)這些對弈中學(xué)習(xí)到的方法,提升自己的技術(shù)與策略,從而迅速成為水平甚至能夠擊敗人類最頂尖大師的圍棋專家。

  蘇勒曼表示:“人工智能面臨的重大挑戰(zhàn)還在于那些缺乏大規(guī)模標(biāo)記數(shù)據(jù)集的領(lǐng)域,或者難以對相關(guān)環(huán)境進(jìn)行較好模擬的領(lǐng)域?!彼f:“語言就是這種領(lǐng)域的一個很好例子?;ヂ?lián)網(wǎng)上包含有無窮無盡的網(wǎng)頁,但上面全都是文字,沒有一個地方找得到以機器能夠理解的形式所書寫的關(guān)于這些文字‘意思’的內(nèi)容。”

  “Maluuba”公司目前正致力于開發(fā)一種算法,其能夠閱讀文字并回答關(guān)于這段文字的問題,但蘇勒曼表示語言的一些特點讓這項工作變得尤其困難。僅舉一例,語言的復(fù)雜性難以想象——某一段文字可以有不同深度上不同的意思,其中的每一個字、每一個詞和每一句句子都有著各自的含義。這些不同的含義可以相互組成成近乎無限多的組合,而且不同的人使用語言的方式和風(fēng)格又不一樣。

  除此之外,所有的語言都是抽象的:文字只是真實世界中事物的抽象標(biāo)記,而所有這些真實世界中的事物對于機器來說都是它從未經(jīng)歷過的。威特森表示:“從機器學(xué)習(xí)的角度來看,學(xué)習(xí)完成后的機器水平也不過是和你輸入其中的數(shù)據(jù)量所能提供的信息相當(dāng)。”

  由于缺乏對真實世界的體驗數(shù)據(jù)以及人類社會已經(jīng)積累起來的數(shù)量巨大的社會互動經(jīng)驗,很容易理解為為何微軟公司的聊天機器人Tay無法很好地理解什么是“Holocaust”(大屠殺),以及為何否認(rèn)它是一種不合適的行為。

  未來發(fā)展

  但盡管面臨這樣或是那樣的挑戰(zhàn),Maluuba公司在上個月在論文預(yù)印本網(wǎng)站arXiv上貼出一篇論文,描述了該公司目前開發(fā)出的一款智能系統(tǒng)已經(jīng)能夠以大約70%的正確率閱讀一篇它不熟悉的文章,并回答關(guān)于這段文章的多選題。這樣的準(zhǔn)確率水平已經(jīng)超出同類其他系統(tǒng)最高水平15%以上。Maluuba公司研究人員所采用的技術(shù)方法結(jié)合了深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過這兩者之間的相互作用輸出非常初級的推理結(jié)果。這家公司目前同樣還致力于機器語音對話系統(tǒng)的開發(fā),其設(shè)計目標(biāo)是能夠非常自然流暢地介入與人類之間的正常對話。

  賽爾曼表示,未來在一些主題內(nèi)容較為有限的領(lǐng)域,側(cè)重語言能力的人工智能將擁有極大的應(yīng)用前景。比如說一些技術(shù)支持熱線在未來可能就將逐漸由人工智能代替,另外一些常規(guī)性的管理崗位,其職責(zé)主要就是升級一些表格并發(fā)送一些格式化的郵件,那么這樣的工作就很可能可以由人工智能代替,并且它們或許可以做的更好。

  賽爾曼說:“而在一些不受控制的,非常開放環(huán)境下的設(shè)置中,履行任務(wù)將需要借助人類智力的多種維度,并且需要你真正理解他人。在這樣的領(lǐng)域,人工智能就會出現(xiàn)非常明顯的局限性?!?/p>

  但威特森也指出,即便在這些方面,進(jìn)步仍然是明顯的。比如谷歌公司正在開發(fā)的全自動無人駕駛汽車就是一個很好的例子。與真實的人類駕駛員所駕駛的車輛在同一條公路上行駛,計算機所需要掌握的顯然并不僅僅是交通法規(guī),它還需要能夠理解并遵循一些不成文的社會準(zhǔn)則并在避讓碰撞風(fēng)險時應(yīng)對一些道德層面的兩難問題。

  正如人工智能和機器人領(lǐng)域的技術(shù)進(jìn)展大大增加了真實世界中機器的使用量一樣,機器與人類的自然互動也將不再只是停留在科幻領(lǐng)域。研究人員目前正在尋找新的途徑來幫助機器不僅能夠感知,還能夠理解它周圍的世界。

  威特森表示:“深度學(xué)習(xí)是一項偉大的技術(shù),但它并非萬能。還有很多事情有待完善,因此自然而然的下一步,也就是人們目前正在做的事情就是,如何在深度學(xué)習(xí)中加入更多的東西,從而使它能夠具備更多功能?!彼f:“現(xiàn)在所有這些問題,包括我們需要機器做些什么,以及我們?nèi)绾谓虝鼈內(nèi)プ鲞@些事,因為這些事具有現(xiàn)實的重要性,因此人們現(xiàn)在對它們更加重視了。”


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。