央廣網(wǎng)北京12月9日消息 據(jù)中央廣播電視總臺(tái)中國之聲《新聞超鏈接》報(bào)道,2021世界人工智能圍棋賽近日落幕,衛(wèi)冕冠軍“星陣圍棋”以4比0的比分零封對(duì)手“天狗”,第六次斬獲世界人工智能圍棋大賽冠軍。此次大賽代表了當(dāng)今圍棋人工智能的最高水平,決賽階段總計(jì)留下11局精彩棋譜供人研究。不同的人工智能在算法上有何區(qū)別?什么因素決定了水平的高低?人工智能通過對(duì)圍棋這一領(lǐng)域的學(xué)習(xí),最終能達(dá)到什么目標(biāo)?
比賽現(xiàn)場(央廣網(wǎng)發(fā) 陳堅(jiān) 攝)
人工智能是怎么下圍棋的?每一手需要多長時(shí)間?
據(jù)“星陣圍棋”主創(chuàng)人、深客科技CEO金涬博士介紹,人工智能圍棋對(duì)弈經(jīng)歷了很大的變化發(fā)展。最初的人工智能比賽使用實(shí)體棋盤,由雙方的選手各自操縱自己的電腦,面對(duì)面把電腦上的招法擺到實(shí)體棋盤上。雖然看似富有儀式感,但也潛藏問題。一些不太熟悉圍棋的開發(fā)者,一旦落錯(cuò)棋子就會(huì)葬送掉一盤好棋,人為削弱人工智能的優(yōu)勢。
針對(duì)實(shí)體棋盤比賽的缺陷,最近幾年主辦方開發(fā)了線上對(duì)弈平臺(tái)。利于場內(nèi)大屏幕觀賽和線上視頻轉(zhuǎn)播,提高了比賽的便利性與公平性。
人工智能思考每一手的時(shí)間都是一個(gè)可以調(diào)節(jié)的參數(shù),目前每一手棋通常不會(huì)超過30秒,一盤棋大概兩個(gè)小時(shí)之內(nèi)就能完成。比賽的過程中,開發(fā)者雖然看起來不用做什么,但在旁觀的同時(shí)需要緊盯著后臺(tái)的數(shù)據(jù),檢查己方程序有沒有占到優(yōu)勢。
圍棋AI技術(shù)水平的高低由什么決定?
目前參加比賽的人工智能團(tuán)隊(duì)或多或少都借鑒了“阿爾法狗”的基本技術(shù)架構(gòu),“阿爾法狗”在《Nature》雜志上發(fā)表了兩篇高水平的論文,比較詳細(xì)地闡述了他們訓(xùn)練圍棋AI的技術(shù)方法。但技術(shù)是迭代發(fā)展的,現(xiàn)在,各個(gè)團(tuán)隊(duì)在算法上的區(qū)別就體現(xiàn)在他們在這個(gè)基礎(chǔ)上的優(yōu)化程度,這些新的優(yōu)化的有效性決定了當(dāng)前參賽隊(duì)伍的水平高低。
“星陣圍棋”的水平與人們所熟知的“阿爾法狗”比起來怎樣?
“阿爾法狗”是當(dāng)今高水平圍棋AI的一個(gè)領(lǐng)路人,它將人工智能與深度學(xué)習(xí)兩項(xiàng)技術(shù)和圍棋相結(jié)合,給我們打開了一扇門。金涬表示,平心而論,“星陣圍棋”的技術(shù)創(chuàng)新性還比不上“阿爾法狗”。現(xiàn)如今的各個(gè)圍棋AI,包括“星陣圍棋”,都是基于“阿爾法狗”的基本架構(gòu)開發(fā)的,是站在巨人肩膀上的創(chuàng)新。如今“阿爾法狗”已經(jīng)退出了圍棋的研發(fā),“星陣圍棋”仍在繼續(xù)以“將人類探索圍棋的水平帶上新高度”作為團(tuán)隊(duì)目標(biāo)。
另外,“星陣”團(tuán)隊(duì)除了做高水平的對(duì)弈AI外,還圍繞圍棋做了很多工作。例如開發(fā)網(wǎng)頁、App,提供覆蓋從初學(xué)到人類頂尖水平的陪練AI等,用戶在棋局之后可請教“星陣”進(jìn)行復(fù)盤,找出本局中欠妥的下法,以達(dá)到棋藝的快速進(jìn)步。
“我只想說從這個(gè)角度上講,如果我們把‘阿爾法狗’比作是發(fā)明了飛機(jī)的萊特兄弟,那么‘星陣’可能就是讓每一個(gè)人都能坐上飛機(jī)的波音公司。”金涬說。
通過研究圍棋領(lǐng)域,人工智能的最終目的是什么?
博弈論中,圍棋被認(rèn)為是完全信息博弈“皇冠上的明珠”,因此圍棋算法成為了很多計(jì)算機(jī)科學(xué)家長久以來的追求和想要攀登的高峰。雖說圍棋AI已在今日達(dá)到了一定水平,但距離完全破解圍棋還十分遙遠(yuǎn)。因此,圍棋可以作為人工智能算法的一片試驗(yàn)田,借此科學(xué)家們可以做出能在更廣泛的領(lǐng)域發(fā)揮更大價(jià)值的人工智能算法。
DeepMind 團(tuán)隊(duì)在研發(fā)完成“阿爾法狗”后,已經(jīng)將精力轉(zhuǎn)向了一些更為實(shí)用化的領(lǐng)域,比如通過強(qiáng)化學(xué)習(xí)算法為數(shù)據(jù)中心節(jié)能,或者通過深度學(xué)習(xí)預(yù)測蛋白質(zhì)的結(jié)構(gòu),通過人工智能預(yù)測新能源的發(fā)電功率,通過圖像人工智能技術(shù)做基于醫(yī)療影像的診斷,這些都是十分有前景和有價(jià)值的。人類研究人工智能的最終目的還是為人類所用,能夠創(chuàng)造出在各個(gè)領(lǐng)域替代人類工作的、更加智能的機(jī)器。