《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > AI系統(tǒng)真能生成圖像,通過(guò)算法實(shí)現(xiàn)“造夢(mèng)”?

AI系統(tǒng)真能生成圖像,通過(guò)算法實(shí)現(xiàn)“造夢(mèng)”?

2019-05-12
關(guān)鍵詞: 遺傳算法 XDREAM AI系統(tǒng)

  還記得電影《盜夢(mèng)空間》中的“造夢(mèng)師”嗎?

  他們可以制造出多層夢(mèng)境,把某種意念植入人的大腦,還能從人的夢(mèng)中竊取情報(bào)。

5cd4c48173c03-thumb.jpg

  前不久,就有人發(fā)明出了一個(gè)名叫“XDREAM”的算法,可以通過(guò)圖像刺激大腦神經(jīng)活動(dòng),從而控制某些特定神經(jīng)元。這一次他們的對(duì)象,只是猴子。

5cd4c48209e6d-thumb.jpg

  AI造夢(mèng):還原猴子眼中的世界

  5月2日,頂級(jí)學(xué)術(shù)期刊《CELL》(《細(xì)胞》)發(fā)表了一篇論文,哈佛大學(xué)的科學(xué)家把猴子的大腦與傳感器和神經(jīng)網(wǎng)絡(luò)連接起來(lái),向猴子播放AI系統(tǒng)生成的圖像,采集并分析猴子看到不同圖像時(shí)的神經(jīng)元活動(dòng),并根據(jù)猴子的反應(yīng)強(qiáng)度來(lái)實(shí)時(shí)調(diào)整和生成新的圖像。

  最終的實(shí)驗(yàn)成果顯示,AI系統(tǒng)已經(jīng)能夠自動(dòng)生成激活單個(gè)腦區(qū)的圖像,刺激到猴子大腦的特定神經(jīng)元(實(shí)驗(yàn)中是識(shí)別面部)。

  這項(xiàng)研究的特別之處在于,算法生成的圖像,比起對(duì)照組中的自然圖像,對(duì)腦補(bǔ)神經(jīng)元的刺激程序更好。換句話說(shuō),這些看起來(lái)像是真實(shí)世界扭曲版本的圖片,可能才是猴子最興奮的畫面。

  論文的第一作者卡洛斯·龐斯,在項(xiàng)目中時(shí)是哈佛醫(yī)學(xué)院瑪格麗特·利文斯通實(shí)驗(yàn)室的博士后研究員,現(xiàn)在則是圣路易斯華盛頓大學(xué)的一名教師。他表示,使用這個(gè)算法工具生成的圖片時(shí),“(猴子大腦的)細(xì)胞活躍度提高到了我們前所未見(jiàn)的水平?!?/p>

5cd4c481db420-thumb.jpg

  這個(gè)圖顯示了自然圖像(右)和猴子神經(jīng)元進(jìn)化的圖像(左)

  被命名為XDREAM的算法,是由威爾·肖在兒童醫(yī)院加布里埃爾·克賴曼實(shí)驗(yàn)室開(kāi)發(fā)的,并得到了美國(guó)國(guó)立衛(wèi)生研究院和國(guó)家科學(xué)基金會(huì)的資助,這是第一次在真實(shí)的神經(jīng)元上進(jìn)行測(cè)試。

  它對(duì)一系列圖像進(jìn)行變異與重新組合,變成了一堆奇怪的東西,比如穿著外科手術(shù)服的熟人、動(dòng)物房間里的漏斗……和人類夢(mèng)境中奇怪的事物有點(diǎn)異曲同工之妙。

  XDREAM生成的圖片更像是神經(jīng)元之間相互溝通所使用的語(yǔ)言,有的東西甚至根本不存在。難怪作者龐斯說(shuō),“如果細(xì)胞會(huì)做夢(mèng),那么這些可能就是細(xì)胞夢(mèng)見(jiàn)的景象。”

  GAN再立新功,

  繪制夢(mèng)境有何難?

  系統(tǒng)生成的圖像比真實(shí)的事物更讓猴子感到興奮,這項(xiàng)發(fā)現(xiàn)能夠帶來(lái)哪些想象空間?

  想要回答這個(gè)問(wèn)題,我們可能需要再往前一步,先探尋視覺(jué)神經(jīng)元的底層機(jī)理。

  腦科學(xué)領(lǐng)域的研究者們已經(jīng)通過(guò)無(wú)數(shù)神經(jīng)元測(cè)試實(shí)驗(yàn)證明了,大腦視覺(jué)神經(jīng)元會(huì)對(duì)某些圖像反應(yīng)更強(qiáng)烈,這種“不均衡響應(yīng)”使我們能夠在茫茫人海中被某些特定形狀、顏色或輪廓所吸引,從而快速識(shí)別出那些特別的事物,比如在火車站找到熟人,高速路旁的廣告牌文字等等。

  但是,視覺(jué)神經(jīng)元究竟是如何對(duì)這些特定事物產(chǎn)生反應(yīng)的,至今仍然是一個(gè)謎。

  以往,在研究視覺(jué)神經(jīng)元偏好的研究中,人們往往會(huì)使用真實(shí)存在的圖像。這就帶來(lái)了兩個(gè)問(wèn)題:

  一是只能研究那些現(xiàn)實(shí)世界中存在的刺激源。但實(shí)際上,人在快速眼動(dòng)(REM)睡眠期間還保持著高頻的腦部活動(dòng)。美國(guó)威斯康辛大學(xué)麥迪遜分校的Giulio Tononi及同事記錄了32個(gè)被試對(duì)象睡著時(shí)的腦電圖,證明參與真實(shí)感官刺激(比如面部和語(yǔ)言)處理的腦區(qū)的高頻活動(dòng)增加了,而且只在夢(mèng)境中出現(xiàn)這些元素時(shí)增加。但做過(guò)夢(mèng)的人都知道,夢(mèng)境是很難完整回憶和復(fù)現(xiàn)的,也并不與現(xiàn)實(shí)世界完全一致。無(wú)法得知夢(mèng)境的樣子,就使得腦神經(jīng)研究丟失了一塊重要陣地。

  二是令腦神經(jīng)研究帶有上了研究人員的主觀選擇,有一定的片面性。舉個(gè)例子,大家都知道卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展從大腦神經(jīng)中得到了很多啟發(fā),也因此產(chǎn)生了很多模擬人類腦活動(dòng)的算法,比如基于注意力的標(biāo)注模型,它會(huì)關(guān)注圖片中的一些重點(diǎn)并對(duì)其進(jìn)行文字描述,比如對(duì)下面這張圖片:

5cd4c482cb7e5-thumb.jpg

  對(duì)圖案中的特征進(jìn)行有選擇的提取,于是我們得到了一個(gè)帶有“海上沖浪者”標(biāo)簽的圖片。

5cd4c48282183-thumb.jpg

  在模型預(yù)訓(xùn)練時(shí),設(shè)計(jì)人員都會(huì)根據(jù)自己的理解和大多數(shù)人類的偏好,對(duì)圖片特征賦予一定的權(quán)重進(jìn)行預(yù)訓(xùn)練,讓系統(tǒng)優(yōu)先注意到那些希望它注意到的地方。但這種選擇真的萬(wàn)無(wú)一失嗎?從科學(xué)的角度講,我們無(wú)法肯定地回答這個(gè)問(wèn)題,但以前我們也沒(méi)有證據(jù)能夠證明,有的大腦可能不是這么想的,有的大腦比起面孔就是更容易對(duì)文字產(chǎn)生興奮。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。