《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 人工智能專家:德州撲克AI與AlphaGo有啥不同

人工智能專家:德州撲克AI與AlphaGo有啥不同

2017-03-31

1490858008800019308.jpg

2015年創(chuàng)新工場CEO李開復(fù)(微博)獲卡內(nèi)基梅隆大學頒給榮譽博士畢業(yè)演講前,與計算機學院院長Andrew Moore合影(中:李開復(fù)/右:Andrew Moore)

近日,一條關(guān)于“人機大戰(zhàn)”的新聞刷遍了朋友圈。這次不是比賽圍棋,而是德州撲克。

2017年4月6日至10日,由創(chuàng)新工場CEO李開復(fù)發(fā)起,邀請母校美國卡內(nèi)基梅隆大學(Carnegie Mellon University)知名的Libratus撲克機器人主創(chuàng)團隊訪問中國,于海南進行一場“冷撲大師v.s.中國龍之隊—人工智能和頂尖牌手巔峰表演賽”,對陣由中國撲克高手杜悅帶領(lǐng)的“中國龍之隊”,這也是亞洲首度舉辦的人工智能與真人對打的撲克賽事。

在比賽前夕,騰訊科技也專訪到卡內(nèi)基梅隆大學計算機學院院長Andrew Moore,就冷撲大師的算法、應(yīng)對德州撲克心理戰(zhàn)、未來商業(yè)化等話題進行了交流。

冷撲大師的基礎(chǔ)是大量的數(shù)學計算

眾所周知,心理戰(zhàn)是德州撲克相當重要的一部分,除去無法控制的運氣,和累積經(jīng)驗下來的技術(shù),剩下就是心理層面的,這也是德州有趣的地方。所以,通過對手的動作表情判斷對手牌的強弱,是德州撲克相當重要的一種游戲技巧,而冷撲大師作為一個冷冰冰的人工智能系統(tǒng),是如何應(yīng)對人類棋手復(fù)雜的心理戰(zhàn)呢?

對于騰訊科技的這個疑問,Andrew Moore表示,冷撲大師并沒有用到任何心理戰(zhàn)的機制,完全用的是大量的數(shù)學,實際算法并不是讓機器學習所謂“詐和”的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點還是少一點才能產(chǎn)生最高的勝率。

和AlphaGo有哪些不同?

作為知名的人工智能系統(tǒng),冷撲大師免不了會與AlphaGo進行一番比較。Andrew Moore認為,其實撲克比圍棋來說,游戲規(guī)則相對簡單,但具有大量的隱藏信息。圍棋沒有隱藏信息,但是每一步必須進行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進行檢查。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機器學習這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃。

助力談判博弈或是商業(yè)化前景

任何一種技術(shù),最終肯定是要服務(wù)人類、幫助企業(yè)盈利,關(guān)于冷撲大師的商業(yè)計劃,Andrew Moore表示,他自己最喜歡的一個商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動的商業(yè)談判算法來進行,甚至可以通過AI去摸清談判對象的底線和談判邏輯。

以下為騰訊科技整理的專訪實錄:

騰訊科技:打德州撲克很重要的一個因素是心理戰(zhàn),我想知道在心理戰(zhàn)當中人工智能如何發(fā)揮作用的?

Andrew Moore:我們CMU學校所研發(fā)的人機撲克對戰(zhàn),背后并沒有用到任何心理戰(zhàn)的機制,完全用的是大量的數(shù)學。所以舉撲克中的詐和,實際演算法里面并不是讓機器學詐和的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點詐和還是少一點詐和才能產(chǎn)生最高的勝率,背后還是數(shù)學。

騰訊科技:未來冷撲大師AI商業(yè)化的運作怎么樣?除了通過打德州撲克驗證了它處理不完美信息的能力,未來商業(yè)化最終的目的是什么?

Andrew Moore:我自己最喜歡的一個商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動的商業(yè)談判算法來進行。

騰訊科技:是指在談判過程當中根據(jù)大數(shù)據(jù)得出對方的底價,或者推敲對方議價的邏輯嗎?

Andrew Moore:是的,這個過程當中的商業(yè)談判就可以被自動化,AI會驅(qū)動自動化時代的到來。

問:撲克機器人最大的亮點是可以處理信息,也學會隱藏信息,是不是意味著電腦很快有一天也能夠?qū)W會主動隱藏信息,如果這樣的事情發(fā)生,這樣會不會讓人們覺得非常的恐懼跟擔憂?

Andrew Moore:我分兩部分回答這個問題,第一部分關(guān)于現(xiàn)在我們CMU在研發(fā)的AI談判技術(shù),其中一部分是關(guān)于隱藏事實。其中一個領(lǐng)域是關(guān)于拍賣或者競標的形式,現(xiàn)在競拍的形式在很多地方都已經(jīng)被廣泛應(yīng)用了,比如說廣告的競價排名,甚至一些物流運輸業(yè)行業(yè)也用到競拍競標的機制,競拍中間的過程其實相對是復(fù)雜的,雙方要經(jīng)過序列式的猜測,我先猜你再猜,所以有一個順序性的隱藏信息在逐步被揭露。

現(xiàn)在有一個非常聰明的機制,這個聰明的機制基于不同于傳統(tǒng)競標方式的一個演算法,叫做第二價格競拍,但目的是為了去贏得這個競拍,研究出來最好的策略是永遠保持誠實。這個機制當中,科學家在發(fā)明AI談判算法的時候所用的策略就是盡可能地促使每一個參與者都說實話,第二價格競拍其實在傳統(tǒng)拍賣行業(yè)中不是一個新制度,但在AI領(lǐng)域反而促進了全新發(fā)明。

第二部分說明,是有關(guān)對抗所有的網(wǎng)絡(luò)攻擊或者垃圾郵件的技術(shù)。所有電子郵箱的服務(wù)供應(yīng)商過往都投注大量資源研發(fā)各種方法來阻擋垃圾郵件,但是他們絕對不能公布這些方法,一旦公布很快就會被破解了,被想攻擊的不法分子所用。對于所謂的“壞蛋”,我們反而是需要一些被隱藏的演算法來欺騙他們,不告訴他們實話。

你問到科學家在做的算法或者所發(fā)明的程序,會不會有一天自己有學習能力反過來欺騙了人類?我的回答是,在現(xiàn)階段還沒有什么方式會促使電腦自己產(chǎn)生動機去做這件事情,現(xiàn)階段的技術(shù)領(lǐng)域,電腦沒有辦法自行產(chǎn)生一個動機想去欺騙人。

問:AI圍棋和AI撲克有什么不同?AI撲克是否用到神經(jīng)網(wǎng)絡(luò)和機器學習?

Andrew Moore:其實撲克比圍棋來說,游戲規(guī)則相對簡單,但具有大量的隱藏信息。圍棋沒有隱藏信息,但是每一步必須進行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進行檢查。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機器學習這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃(linear programming)。

問:請您談?wù)剬τ谥袊鳤I市場的看法,以及AI技術(shù)在中國市場的潛力。

Andrew Moore:我對于現(xiàn)在在中國市場對AI領(lǐng)域有這么熱切的投資興趣非常認同,更重要的是,我們看到AI能夠很實質(zhì)在不同產(chǎn)業(yè)被大量導(dǎo)入在自動化領(lǐng)域,很多現(xiàn)在的產(chǎn)業(yè)運作方式會被大量的自動化。我個人對于去發(fā)展一些平臺式技術(shù)不那么感興趣,我更感興趣的是一些特定垂直領(lǐng)域的解決方案,特別是能在實際生活或商業(yè)上被用到的場景,所以我也鼓勵中國的創(chuàng)業(yè)者,盡量設(shè)定特定垂直領(lǐng)域的一些應(yīng)用發(fā)展。

比如說兩個例子,一個是某個創(chuàng)業(yè)者針對有自閉癥的孩子去研發(fā)一種新的解決方案,這就非常棒。但是如果只是平臺式思維想要讓機器學習更精進那么一點點,就不怎么吸引我。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。