2022年,ChatGPT問世。
一經(jīng)出現(xiàn)便掀起滔天巨浪。
如果你跟ChatGPT聊過天,一定會(huì)震撼于它所涉獵極廣:
既能創(chuàng)造詩(shī)歌,也能修改代碼。
可以批改作業(yè),還能撰寫論文。
寫文案易如反掌,給方案不在話下。
......
有人興奮,有人恐慌。
有人說,它會(huì)帶來一次新的“工業(yè)革命”。
有人說,它會(huì)引發(fā)21世紀(jì)的“新盧德運(yùn)動(dòng)”。
這其實(shí)不是AI第一次向人類展示它的力量。
自動(dòng)駕駛、MIT主導(dǎo)的人類寫字系統(tǒng)、SIRI智能語音助手、AlphaGo......
但這一次,ChatGPT確實(shí)驚嚇到了人類。
我們能抵擋來勢(shì)洶洶的AIGC狂潮嗎?
人類是不是真的會(huì)被ChatGPT取代?
要回答這些問題,讓我們先回歸數(shù)學(xué)。
因?yàn)镃hatGPT背后的核心本質(zhì),是“貝葉斯公式”。
1
什么是貝葉斯公式?
歷史有許多天才,生前籍籍無名,死后眾人崇拜。
18世紀(jì)數(shù)學(xué)家托馬斯·貝葉斯也是其中一位。
“貝葉斯”定理源于解決“逆向概率”問題時(shí)寫的論文。
在此之前,人們只會(huì)計(jì)算“正向概率”。
什么是“正向概率”呢:
假設(shè)袋子里面有P只紅球,Q只白球,它們除了顏色之外,其它性狀完全一樣。你伸手進(jìn)去摸一把,摸到紅球的概率是多少是可以推算出來的。
但反過來是否也可以計(jì)算,我們可以將它視為“逆向概率”:
如果我們事先并不知道袋子里面紅球和白球的比例,而是閉著眼睛摸出一些球,然后根據(jù)手中紅球和白球的比例,對(duì)袋子里紅球和白球的比例作出推測(cè)。
這個(gè)問題就是逆向概率問題。
通俗地講,就像一個(gè)迷信星座的HR,如果碰到一個(gè)處女座應(yīng)聘者,HR會(huì)推斷那個(gè)人多半是一個(gè)追求完美的人。
這就是說,當(dāng)你不能準(zhǔn)確知悉某個(gè)事物本質(zhì)時(shí),你可以依靠經(jīng)驗(yàn)去判斷其本質(zhì)屬性。
這個(gè)研究看起來平淡無奇,名不見經(jīng)傳的貝葉斯也未引人注意。
他寫的論文直到他死后的第二年,才由他的一位朋友在1763年發(fā)表。
明珠蒙塵,就像畫界的梵高,畫稿生前無人問津,死后價(jià)值連城。
為什么貝葉斯定理200多年來一直被雪藏,不受科學(xué)家待見?
因?yàn)樗c當(dāng)時(shí)的經(jīng)典統(tǒng)計(jì)學(xué)相悖,甚至是“不科學(xué)”的。
經(jīng)典統(tǒng)計(jì)學(xué)中,數(shù)字規(guī)律來源于隨機(jī)取樣再行計(jì)算。
貝葉斯方法則建立在主觀判斷基礎(chǔ)上,你可以先估計(jì)一個(gè)值,然后根據(jù)客觀事實(shí)不斷修正。
從主觀猜測(cè)出發(fā),這顯然不符合科學(xué)精神,所以貝葉斯定理為人詬病。
1774年,法國(guó)的大數(shù)學(xué)家拉普拉斯也看到貝葉斯定理的價(jià)值。
不過他知道人類的普遍毛病,總是用傳統(tǒng)來反對(duì)新思想。
他懶得與人爭(zhēng)論,直接給出數(shù)學(xué)表達(dá):
2
貝葉斯公式是怎么工作的?
貝葉斯定理簡(jiǎn)單優(yōu)雅、深刻雋永。
貝葉斯定理并不好懂,每一個(gè)因子背后都藏著深意。
它到底是如何“為人民服務(wù)”的呢?
對(duì)于貝葉斯定理,參照上面的公式,首先要了解各個(gè)概率所對(duì)應(yīng)的事件。
P(A|B)是在B發(fā)生的情況下A發(fā)生的概率;
P(A)是A發(fā)生的概率;
P(B|A)是在A發(fā)生的情況下B發(fā)生的概率;
P(B)是B發(fā)生的概率。
3
貝葉斯公式取得人類信任
今天的貝葉斯理論開始遍布一切。從物理學(xué)到癌癥研究,從生態(tài)學(xué)到心理學(xué)。
貝葉斯定理幾乎像“熱力學(xué)第二定律”一樣放之宇宙皆準(zhǔn)了。
物理學(xué)家提出了量子機(jī)器的貝葉斯解釋,以及貝葉斯捍衛(wèi)了弦和多重宇宙理論。
哲學(xué)家主張作為一個(gè)整體的科學(xué)可以被視為一個(gè)貝葉斯過程。
在IT界,AI大腦的思考和決策過程,被更多工程師設(shè)計(jì)成一個(gè)貝葉斯程序。
但貝葉斯誕生以來命途多舛,長(zhǎng)期以來因?yàn)楸砻娴牟豢茖W(xué),并沒有得到主流學(xué)界認(rèn)可。
其實(shí)在日常生活中,我們也常使用貝葉斯公式進(jìn)行決策。比如我們到河邊釣魚,根本就看不清楚河里哪里有魚或者沒魚,似乎只能隨機(jī)選擇,但實(shí)際上我們會(huì)根據(jù)貝葉斯方法,利用以往積累經(jīng)驗(yàn)找一個(gè)回水灣區(qū)開始垂釣。
這就是我們根據(jù)先驗(yàn)知識(shí)進(jìn)行主觀判斷,在釣過以后對(duì)這個(gè)地方有了更多了解,然后再進(jìn)行選擇。所以,在我們認(rèn)識(shí)事物不全面的情況下,貝葉斯方法是一種非常理性且科學(xué)的方法。
貝葉斯公式得到主流科學(xué)界的認(rèn)可,主要因?yàn)閮杉拢?/p>
《聯(lián)邦黨人文集》作者揭密
1788年,《聯(lián)邦黨人文集》匿名出版,兩位作者寫作風(fēng)格幾乎一致。其中12篇文章作者存在爭(zhēng)議,而要找出每一篇文章的作者極其困難。
兩位統(tǒng)計(jì)學(xué)教授采用以貝葉斯公式為核心的分類算法,10多年的時(shí)間,他們推斷出12篇文章的作者,而他們的研究方法也在統(tǒng)計(jì)學(xué)界引發(fā)轟動(dòng)。
美國(guó)天蝎號(hào)核潛艇搜救
1968年5月,美國(guó)海軍天蝎號(hào)核潛艇在大西洋亞速海海域失蹤。軍方通過各種技術(shù)手段調(diào)查無果,最后不得不求助于數(shù)學(xué)家John Craven,John Craven提出的方案使用了貝葉斯公式,搜索某個(gè)區(qū)域后根據(jù)搜索結(jié)果修正概率圖,再逐個(gè)排除小概率的搜索區(qū)域,幾個(gè)月后,潛艇果然在爆炸點(diǎn)西南方的海底被找到了。
2014年初馬航MH370航班失聯(lián)后,科學(xué)家想到第一個(gè)方法就是利用貝葉斯定理開始區(qū)域搜索,這個(gè)時(shí)候,貝葉斯公式已經(jīng)名滿天下了。
4
貝葉斯公式展示“神跡”
當(dāng)然,貝葉斯定理名揚(yáng)天下,主要還是在人工智能領(lǐng)域的應(yīng)用。
特別是自然語音的技術(shù)識(shí)別,讓人類見識(shí)了A.I.的“思考力”。
人類語言的多義性,可以說是信息里最復(fù)雜最動(dòng)態(tài)的一部分。
機(jī)器怎么知道你在說什么?
當(dāng)看到機(jī)器翻譯的準(zhǔn)確性,你也會(huì)感嘆這簡(jiǎn)直就是“神跡”,它們比大部分現(xiàn)場(chǎng)翻譯要強(qiáng)得多。
語音識(shí)別本質(zhì)上是找到概率最大的文字序列。
一旦出現(xiàn)條件概率,貝葉斯定理總能挺身而出。
我們用P(f|e)區(qū)別于以上的P(A|B)來解釋語音識(shí)別功能。
統(tǒng)計(jì)機(jī)器翻譯的問題可以描述為:給定一個(gè)句子e,它可能的外文翻譯f中哪個(gè)是最靠譜的。
即我們需要計(jì)算:P(f|e)
P(f|e) ∝ P(f) * P(e|f)
這個(gè)式子的右端很容易解釋:
那些先驗(yàn)概率較高,并且更可能生成句子e的外文句子f將會(huì)勝出。
我們只需簡(jiǎn)單統(tǒng)計(jì)就可以得出任意一個(gè)外文句子f的出現(xiàn)概率。
隨著大量數(shù)據(jù)輸入模型進(jìn)行迭代,隨著計(jì)算能力不斷提高,隨著大數(shù)據(jù)技術(shù)的發(fā)展,貝葉斯定理威力日益凸顯,貝葉斯公式巨大的實(shí)用價(jià)值也愈發(fā)體現(xiàn)出來。
語音識(shí)別僅僅只是貝葉斯公式運(yùn)用的其中一個(gè)例子。
實(shí)際上,貝葉斯思想已經(jīng)滲透到了人工智能方方面面。
5
貝葉斯網(wǎng)絡(luò),AI智慧的拓展
語音識(shí)別,見證了貝葉斯定理的能力。
貝葉斯網(wǎng)絡(luò)的拓展,則可以看到更強(qiáng)大的人工智能未來。
借助經(jīng)典統(tǒng)計(jì)學(xué),人類已經(jīng)解決了一些相對(duì)簡(jiǎn)單的問題。
然而經(jīng)典統(tǒng)計(jì)學(xué)方法卻無法解釋復(fù)雜參數(shù)所導(dǎo)致的現(xiàn)象,例如:
龍卷風(fēng)的成因,2的50次方種可能的最小參數(shù)值比對(duì);
星系起源,2的350次方種可能的星云數(shù)據(jù)處理;
大腦運(yùn)作機(jī)制,2的1000次方種可能的意識(shí)量子流;
癌癥致病基因,2的20000次方種可能的基因圖譜;
……
面對(duì)這樣數(shù)量級(jí)的運(yùn)算,經(jīng)典統(tǒng)計(jì)學(xué)顯得力不從心。
科學(xué)家別無選擇,最終尋找貝葉斯定理給予幫助。
把某種現(xiàn)象的相關(guān)參數(shù)連接起來,再把數(shù)據(jù)代入貝葉斯公式得到概率值,公式結(jié)網(wǎng)形成一個(gè)成因網(wǎng),即貝葉斯網(wǎng)絡(luò),如下圖所示:
這也是貝葉斯網(wǎng)絡(luò)被稱為概率網(wǎng)絡(luò)、因果網(wǎng)絡(luò)的原因。
利用先驗(yàn)知識(shí)和樣本數(shù)據(jù),確立隨機(jī)變量之間的關(guān)聯(lián),然后得出結(jié)論。
一個(gè)又一個(gè)的節(jié)點(diǎn),一個(gè)又一個(gè)的概率,都來源于人類的先驗(yàn)知識(shí),有效知識(shí)越多,貝葉斯網(wǎng)絡(luò)展示的力量越讓人震撼。
今天一場(chǎng)轟轟烈烈的“貝葉斯革命”正在AI界發(fā)生:
貝葉斯公式已經(jīng)滲入到工程師的骨子里,貝葉斯分類算法也成為主流算法。
在很多工程師眼中,貝葉斯定理就是AI發(fā)展的基石。
結(jié)
人工智能第一課,都是從貝葉斯定理開始。
大數(shù)據(jù)、人工智能和自然語言處理中都大量用到貝葉斯公式。
CHATGPT是如何確定生成的句子是合理的?
背后同樣是貝葉斯公式在主導(dǎo)。
貝葉斯公式有多厲害?
CHATGPT已經(jīng)向我們演示一遍了。
不過,貝葉斯公式與AI的結(jié)合,
到底是一場(chǎng)科學(xué)的革命,還是一場(chǎng)理念的革命?
到底是生產(chǎn)方式的革命,還是人類在革自己的命?
我們無法得知。
在與CHATGPT對(duì)話的過程中,偶爾發(fā)現(xiàn)部分回答有些詭異。
甚至開始擔(dān)心,CHATGPT再這樣下去,會(huì)不會(huì)誕生“自我意識(shí)”?
到那時(shí)候,人類與AI會(huì)不會(huì)真正成為對(duì)立的雙方?
這似乎有點(diǎn)杞人憂天了。
縱觀整個(gè)社會(huì),倒不用太擔(dān)心AI像人一樣思考,最應(yīng)該擔(dān)心人類已經(jīng)失去了思考。