《電子技術(shù)應(yīng)用》
欢迎订阅(电子2025)
欢迎订阅(网数2025)
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 別讓ChatGPT跑了
NI-LabVIEW 2025

別讓ChatGPT跑了

2023-02-03
作者:Neil Shen
來(lái)源:是說(shuō)芯語(yǔ)
關(guān)鍵詞: ChatGPT AI 大模型

  ChatGPT 只是另一場(chǎng)AI噱頭嗎?

  明面上,ChatGPT的熱度在最近降了下來(lái),這實(shí)在是符合許多唱衰AI產(chǎn)業(yè)的人一貫的論調(diào)——就像擊敗國(guó)際象棋冠軍的深藍(lán)、國(guó)際圍棋冠軍的AlphaGo一樣,爆紅的AI工具總是最終歸于平靜。

  因?yàn)檫@些炫酷的工具往往有一個(gè)無(wú)法回避的問(wèn)題:商業(yè)化的前景在哪里?

  從使用場(chǎng)景上說(shuō),除了專業(yè)棋手,沒(méi)有人會(huì)需要每天和機(jī)器人對(duì)弈,而ChatGPT作為一個(gè)吸收了無(wú)數(shù)語(yǔ)言材料,光是模型參數(shù)就有一千七百多億的大模型,目前最適用場(chǎng)景似乎只有完成學(xué)術(shù)論文中內(nèi)容梗概撰寫(xiě)和統(tǒng)一注釋格式,以及幫助論文作者規(guī)避查重風(fēng)險(xiǎn)。說(shuō)實(shí)話,ChatGPT在這方面完成的不錯(cuò),幾乎成了留學(xué)生中的不傳之秘,以至于有華裔學(xué)生專門(mén)寫(xiě)了一個(gè)名為GPTZero的app負(fù)責(zé)辨認(rèn)作業(yè)中ChatGPT生成的內(nèi)容。

  但也僅此而已。從成本角度說(shuō),動(dòng)輒數(shù)千萬(wàn)美元的開(kāi)發(fā)和部署成本讓外界有了堅(jiān)定看衰它的理由,這個(gè)所謂智能聊天工具實(shí)在太過(guò)昂貴,更何況它最讓人驚艷的那部分:對(duì)人類(lèi)語(yǔ)言和對(duì)話邏輯的理解,對(duì)回答內(nèi)容的“生成式”創(chuàng)作,都隨著越來(lái)越多的“翻車(chē)”實(shí)例而迅速“祛魅”。那些認(rèn)為它將取代搜索引擎、顛覆智能語(yǔ)音助手的樂(lè)觀論調(diào)正在消失。

  ChatGPT在大眾視角中似乎即將走上過(guò)往那些AI工具的老路,流星一樣炫目,然后歸于沉寂。

  但,真的僅此而已嗎?

  第一個(gè)造出飛機(jī)的人

  Sheng談到ChatGPT時(shí)充滿了一種興奮和緊張混合的口吻,他是在清華從事預(yù)訓(xùn)練大模型研究的博士生。

  “就在兩年前,要不要走預(yù)訓(xùn)練大模型的方向,整個(gè)學(xué)界還在討論中。”Sheng說(shuō)到,而原因正是上面提到的,大模型一次的訓(xùn)練成本實(shí)在太過(guò)高昂,能得到什么結(jié)果也是未定之?dāng)?shù),很少有人愿意冒險(xiǎn)。國(guó)內(nèi)相關(guān)方向的玩家一度傾向使用大小模型協(xié)同配合的方法提高AI工具效果,因?yàn)閭鹘y(tǒng)觀點(diǎn)認(rèn)為,在規(guī)模相對(duì)較小的模型上進(jìn)行訓(xùn)練,效果并不一定比大模型差。而不止一位AI方向的從業(yè)者也表示,過(guò)去業(yè)內(nèi)對(duì)人工標(biāo)記數(shù)據(jù)的重視也遠(yuǎn)遠(yuǎn)不夠,大家沒(méi)料到ChatGPT采用的基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)效果會(huì)如此之好。

  直到OpenAI推出了ChatGPT。

  “有多少人工,就有多少智能?!边@是人工智能領(lǐng)域經(jīng)常被拿來(lái)調(diào)侃的一句話,用來(lái)形容ChatGPT再合適不過(guò)。作為預(yù)訓(xùn)練大模型,它很好的體現(xiàn)了“大”這個(gè)字。一方面,相比GPT1,GPT3的參數(shù)規(guī)模提升了將近1500倍。另一方面,由于運(yùn)用了所謂的“自監(jiān)督學(xué)習(xí)(self-supervised learning)”機(jī)制,模型可以使用互聯(lián)網(wǎng)上海量的文本數(shù)據(jù)進(jìn)行訓(xùn)練。

  這種級(jí)別的大模型是前所未見(jiàn)的。

  “最近的研究告訴我們,當(dāng)模型達(dá)到一定規(guī)模后,會(huì)有 emergent ability(突現(xiàn)能力)的東西出現(xiàn)?!盨heng說(shuō)到。

  某種程度上講,ChatGPT 的開(kāi)發(fā)者 OpenAI 也是在賭博,沒(méi)有人知道這條路究竟能不能走通,而正是它們持之以恒不惜血本的投入,最終證明了預(yù)訓(xùn)練大模型擁有一般模型所不具備的認(rèn)知理解能力和泛化能力。換而言之,預(yù)訓(xùn)練大模型和人們理想中的AI“通用模型”非常相似。

  不像是AlphaGo專門(mén)針對(duì)圍棋度身定做,ChatGPT不是針對(duì)一個(gè)特定的狹窄領(lǐng)域問(wèn)題開(kāi)發(fā)出來(lái)的AI工具,相反,它可能更像某種尚顯稚嫩的通用AI計(jì)算模型,有回答開(kāi)放問(wèn)題的能力,顯示出可被靈活部署應(yīng)用在各種領(lǐng)域的潛力。

  這正是ChatGPT重要的原因,它向人們展示了預(yù)訓(xùn)練大模型的強(qiáng)大威力。這意味著第三次AI浪潮在經(jīng)過(guò)十多年的發(fā)展后,走到一個(gè)關(guān)鍵節(jié)點(diǎn)。

  “ChatGPT / GPT-3.5 是一種劃時(shí)代的產(chǎn)物,它與之前常見(jiàn)的語(yǔ)言模型幾乎是導(dǎo)彈與弓箭的區(qū)別,一定要引起最高程度的重視?!币黄噲D幫助開(kāi)源社區(qū)復(fù)現(xiàn)GPT3.5技術(shù)路線圖的文章在開(kāi)篇就嚴(yán)肅指出了這一點(diǎn)。(https://zhuanlan.zhihu.com/p/593519656)

  Sheng則把ChatGPT的誕生比作萊特兄弟發(fā)明飛機(jī):“大家都知道飛機(jī)理論上是可以做出來(lái)的,但從來(lái)沒(méi)人真的見(jiàn)過(guò)飛機(jī)。ChatGPT就像是有人突然把飛機(jī)擺到你面前,雖然它可能只能飛100公尺,很容易有故障,但它出現(xiàn)了。

  Bigger than bigger,大模型的潛力還有多少?

  同ChatGPT揭示的AI發(fā)展浪潮中的關(guān)鍵節(jié)點(diǎn)的意義相比,ChatGPT本身的缺陷和孱弱的商業(yè)化前景都顯得渺小了不少。更何況,對(duì)許多從業(yè)者來(lái)說(shuō),ChatGPT暴露出來(lái)的缺點(diǎn)并非不可解決。

  其中一個(gè)為許多人指摘的是所謂數(shù)據(jù)庫(kù)時(shí)限問(wèn)題。ChatGPT訓(xùn)練是基于一個(gè)固定的數(shù)據(jù)庫(kù),截止日期是2021年9月,也就是說(shuō)ChatGPT無(wú)法掌握從那以后世界上發(fā)生的任何事的信息,從iPhone 14的發(fā)布到美國(guó)期中選舉,甚至今天的天氣狀況都不行,在這個(gè)方面,ChatGPT的表現(xiàn)甚至趕不上時(shí)下任何一款智能語(yǔ)音助手。

  但從技術(shù)層面這個(gè)問(wèn)題并不難解決。實(shí)際上,根據(jù)外媒爆料,和Open AI 達(dá)成戰(zhàn)略合作關(guān)系的微軟即將在3月推出具有AI對(duì)話能力的新版必應(yīng)Bing,它的原理正是將搜索引擎同ChatGPT的能力相結(jié)合,甚至,微軟還打算在Office 套件中引入相應(yīng)的能力。

  最為引人關(guān)注的成本問(wèn)題,在算法層面同樣有許多優(yōu)化迭代的思路。比如,既然ChatGPT在回答問(wèn)題過(guò)程中通過(guò)專門(mén)的針對(duì)訓(xùn)練很好展示了機(jī)器模擬人行為的能力,那么在算法層面,讓ChatGPT通過(guò)模仿人查閱資訊的方式,在涉及純粹知識(shí)和信息的問(wèn)題時(shí)不再調(diào)用本身數(shù)據(jù)庫(kù)而是直接從網(wǎng)絡(luò)抓取內(nèi)容將是非常值得探索的方向。如此一來(lái),大模型可以在不降低自身表現(xiàn)的情況下縮小規(guī)模,訓(xùn)練成本也將隨之降低。

  至于商業(yè)化落地場(chǎng)景,除了已經(jīng)比較確定的文本生成、智能助手領(lǐng)域外,實(shí)事求是的說(shuō),還有大片的荒蕪地帶亟待開(kāi)發(fā),但不少?gòu)臉I(yè)者都表示了樂(lè)觀。

  “難的是從0到1的原始創(chuàng)新,至于后面的都不是問(wèn)題。”一位供職于大廠的AI研究從業(yè)者說(shuō)道,“尤其在中國(guó),市場(chǎng)這么大,大家又這么卷,既然大模型的路子被證明是可行的,那么很快所有的聰明人都會(huì)加入進(jìn)來(lái)?!盨heng同樣預(yù)計(jì),短則一兩年,就會(huì)出現(xiàn)基于預(yù)訓(xùn)練大模型的商業(yè)化產(chǎn)品。

  必須攀登的山峰

  事實(shí)上,今年在投資領(lǐng)域,AI是少有的異軍突起的熱門(mén)賽道。然而成本像一道緊箍咒,束縛著每個(gè)自身不具有預(yù)訓(xùn)練大模型開(kāi)發(fā)能力的玩家。

  ChatGPT這樣級(jí)別的預(yù)訓(xùn)練大模型跑一次的成本是千萬(wàn)美元級(jí)別,而將其商業(yè)化部署,落地到類(lèi)似聊天機(jī)器人這樣多用戶高并發(fā)任務(wù)中,成本只會(huì)更高。小冰CEO李笛給出的一個(gè)估計(jì)數(shù)字是3億每天。這也就意味著,國(guó)內(nèi)夠資格玩這場(chǎng)燒錢(qián)游戲的只能是極個(gè)別組織,大部分的初創(chuàng)企業(yè),乃至許多高校,都會(huì)被這樣的高昂成本“勸退”。

  Sun 是來(lái)自一家國(guó)內(nèi)一線投資機(jī)構(gòu)的投資經(jīng)理,在看過(guò)無(wú)數(shù)AI相關(guān)項(xiàng)目的PPT后,他今年一次都沒(méi)有出手:“商業(yè)化項(xiàng)目是很現(xiàn)實(shí)的,你是不是掌握了核心技術(shù)?你的競(jìng)爭(zhēng)壁壘又有多高?”

  很少有中國(guó)企業(yè)能夠回應(yīng)這樣的詰問(wèn)。

  在這種情況下,想要讓產(chǎn)品具有AI能力,只能調(diào)用公開(kāi)的大模型接口(比如GPT3.0),等于讓自己的核心能力掌握在別人手中。

  一個(gè)非常殘酷的例子是Jasper.AI。文本生成領(lǐng)域估值一度高達(dá)15億的Jasper.AI同樣在底層調(diào)用GPT3.0模型,在ChatGPT 幾乎是沒(méi)有預(yù)警的橫空出世后,Jasper的業(yè)務(wù)立刻受到?jīng)_擊(這個(gè)故事被the information 寫(xiě)成了一篇報(bào)道 ),因?yàn)镴asper 的收費(fèi)計(jì)劃最便宜的也高達(dá)29美元,且只能生成20000個(gè)單詞,相比之下,ChatGPT的使用成本簡(jiǎn)直可以忽略不計(jì),而交互和效果甚至更好。

  更何況,OpenAI本身也面臨著經(jīng)營(yíng)壓力。從OpenAI內(nèi)部傳出的消息說(shuō),預(yù)訓(xùn)練大模型的成本之高,OpenAI同樣也叫苦連天,從GPT3.0后OpenAI的模型不再開(kāi)源,而是力推其訂閱付費(fèi)服務(wù)(Jasper即是向OpenAI繳納一定的費(fèi)用從而獲得GPT調(diào)用接口)。

  開(kāi)發(fā)屬于自己的大模型,顯然是每個(gè)在AI領(lǐng)域有野心的企業(yè)所應(yīng)該做的事。

  國(guó)外們的巨頭行動(dòng)很快,除了OpenAI,提出transformer模型的Google同樣擁有專門(mén)針對(duì)對(duì)話應(yīng)用的大語(yǔ)言模型LaMDA和多模態(tài)任務(wù)模型MUM,這兩個(gè)模型被認(rèn)為與ChatGPT擁有相同的能力。而在硅谷,像Perplexity、YouChat這樣的創(chuàng)業(yè)公司也正在大預(yù)言模型的基礎(chǔ)上開(kāi)發(fā)新的聊天機(jī)器人。OpenAI也預(yù)示了GPT4.0的存在,從版本號(hào)上就能看出,屆時(shí)這個(gè)業(yè)界領(lǐng)先的大語(yǔ)言模型將有進(jìn)一步的能力提升。

  因此對(duì)中國(guó)來(lái)說(shuō),時(shí)不我待,預(yù)訓(xùn)練大模型是一塊必須啃下來(lái)的硬骨頭,中國(guó)絕不能錯(cuò)過(guò)這場(chǎng)AI“軍備競(jìng)賽”。不僅因?yàn)橐晃赌7禄蛘邔で箝_(kāi)源模型接口支持,等于讓別人始終掌握掐脖子的科技主動(dòng)權(quán),同時(shí)也將在未來(lái)的AI產(chǎn)業(yè)競(jìng)爭(zhēng)中處于不利地位。

  Sun舉了個(gè)或許不太貼切的例子:質(zhì)能方程在1905年就由愛(ài)因斯坦提出,原子彈在40年后的1945年由美國(guó)人試爆成功,而新中國(guó)為了掌握這項(xiàng)技術(shù),又花了近20年時(shí)間。

  一日千里的AI技術(shù)發(fā)展不會(huì)給中國(guó)這么長(zhǎng)的追趕時(shí)間。

  好消息是,AI技術(shù)并不像芯片制造一樣有著高不可攀的技術(shù)壁壘,盡管沒(méi)有公布ChatGPT的論文,但不止一位AI工程師表示,僅靠現(xiàn)在公開(kāi)的知識(shí),頂級(jí)AI工程團(tuán)隊(duì)很大概率就能復(fù)現(xiàn)和ChatGPT差不多的模型,因?yàn)椤凹夹g(shù)本身都是現(xiàn)成的?!?/p>

  壞消息則是,留給我們的時(shí)間已經(jīng)不多。

  如果說(shuō)ChatGPT誕生來(lái)自巨量資金的投入、充分的技術(shù)和人才儲(chǔ)備,這些條件國(guó)內(nèi)巨頭們尚能夠勉強(qiáng)滿足的話,那么隨著時(shí)間推移,如果不在目前這個(gè)非常重要的機(jī)會(huì)窗口期迎頭趕上,算法迭代所累積的經(jīng)驗(yàn)將給以O(shè)penAI為代表的AI公司帶來(lái)結(jié)構(gòu)性的技術(shù)壁壘與代差,這種代際差一旦形成,再想追趕將分外吃力。

  雖然機(jī)器本質(zhì)上仍然無(wú)法思考或創(chuàng)新,但預(yù)訓(xùn)練大模型“涌現(xiàn)”出的“智能”以及它出色的泛化能力,將使得AI產(chǎn)業(yè)本身不再成為一個(gè)賽道,而是演變?yōu)轭?lèi)似石油、電網(wǎng)一樣的基礎(chǔ)生產(chǎn)力資源,徹底改變整個(gè)信息產(chǎn)業(yè)的格局。

  經(jīng)過(guò)十多年的發(fā)展,基于深度學(xué)習(xí)框架的AI浪潮已經(jīng)找到了一個(gè)明確的發(fā)力方向,隨之而來(lái)的將會(huì)是如同西部掘金大潮一般的熱烈景象,無(wú)數(shù)機(jī)會(huì)和突破將涌現(xiàn)出來(lái),想要在這場(chǎng)烈火烹油的AI革命中跟上,我們必須擁有屬于自己的ChatGPT。否則讓它跑太遠(yuǎn),再追就來(lái)不及了。

  參考資料:

  ChatGPT進(jìn)化的秘密

  https://zhuanlan.zhihu.com/p/593519656

  The Best Little Unicorn in Texas: Jasper Was Winning the AI Race—Then ChatGPT Blew Up the Whole Game

  https://www.theinformation.com/articles/the-best-little-unicorn-in-texas-jasper-was-winning-the-AI-race-then-ChatGPT-blew-up-the-whole-game

 更多信息可以來(lái)這里獲取==>>電子技術(shù)應(yīng)用-AET<<

  微信圖片_20210517164139.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。