《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業(yè)界動態(tài) > 拳打AlphaLee,腳踢AlphaMaster,全新AlphaZero實現(xiàn)自我學習

拳打AlphaLee,腳踢AlphaMaster,全新AlphaZero實現(xiàn)自我學習

2017-10-20
關鍵詞: AlphaZero 自我學習

據(jù)報道,《自然》雜志刊登了谷歌DeepMind團隊的新成果,名為AlphaZero(暫譯:阿爾法元)的機器系統(tǒng)僅訓練3天就戰(zhàn)勝了AlphaGo Lee,比分100:0,后者就是戰(zhàn)敗李世石的那套,經(jīng)過40天訓練后,Alpha Zero又以89:11戰(zhàn)勝了Alpha Master,即橫掃柯潔的那套。

36cddeccb01f87f1cb4af7624486319a.png

據(jù)介紹,更令人震驚的是,Alpha Zero的設計理念和系統(tǒng)配置完全和Lee/Master不同,它不依托于人類的先驗成果,完全靠自我對弈學習下棋。此前,Lee/Master都是用上千盤人類業(yè)余和專業(yè)棋手的棋譜進行訓練。同時,Zero僅配置了4個TPU,Lee則是48個谷歌TPU計算單元。

對于這一進步,人類圍棋現(xiàn)世界第一柯潔以及前世界冠軍古力分別發(fā)表看法,柯潔稱:“一個純凈、純粹自我學習的alphago是最強的...對于alphago的自我進步來講...人類太多余了。”

13b8f2c2acc0438731390ff847ef4bc4.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。