“一年前,大部分的企業(yè)都沒(méi)有和大語(yǔ)言模型打過(guò)交道?!贝鳡柤瘓F(tuán)的首席技術(shù)官John Roese近期接受第一財(cái)經(jīng)采訪(fǎng)時(shí)表示,只有極少數(shù)的公司是例外。
現(xiàn)在大模型的進(jìn)展極快,不少公司都在擁抱它,尋找生成式AI的突破口。John Roese認(rèn)為明年會(huì)是生成式AI真正轉(zhuǎn)變到來(lái)的時(shí)候。與此同時(shí),那些準(zhǔn)備在其業(yè)務(wù)中落地生成式AI的公司會(huì)發(fā)現(xiàn),這項(xiàng)技術(shù)既可能用于財(cái)務(wù)、也可能用于售后,還可能用于編程等。每一項(xiàng)應(yīng)用都需要配置相當(dāng)多的資金和人力,不明智的選擇會(huì)帶來(lái)大量的資源浪費(fèi)和時(shí)間成本,同時(shí)“會(huì)被競(jìng)爭(zhēng)對(duì)手甩到后面,這是很有風(fēng)險(xiǎn)的事情?!?/p>
OpenAI是人工智能曠野里醒目的坐標(biāo),是其他企業(yè)模仿和追逐的對(duì)象,以至于業(yè)內(nèi)認(rèn)為現(xiàn)在的大模型都太雷同了。到了2024年,應(yīng)用端的突破也許比大模型本身更值得期待。
大模型“太雷同”
OpenAI打響了人工智能階段性突圍的一槍。
這之后,美國(guó)、中國(guó)等地的科技公司的恐懼和熱情都被激發(fā)出來(lái)了??謶謥?lái)自于被時(shí)代拋棄的風(fēng)險(xiǎn),熱情則來(lái)自于科技企業(yè)內(nèi)嵌的、對(duì)創(chuàng)新的追求。
美國(guó)參與大模型角逐的公司包括了科技巨頭如谷歌、Meta等,初創(chuàng)企業(yè)則有OpenAI、Anthropic等;中國(guó)則有百度、阿里等頭部科技企業(yè),智譜、百川智能等初創(chuàng)公司。最熱鬧的時(shí)候,中國(guó)企業(yè)就發(fā)布了近百個(gè)大模型。
但在不少業(yè)內(nèi)人士看來(lái),國(guó)內(nèi)外的大模型企業(yè)在做類(lèi)似的工作。
“技術(shù)上面沒(méi)有本質(zhì)的區(qū)別,側(cè)重點(diǎn)不一樣,像Llama就是做一個(gè)通用的技術(shù)模型開(kāi)源出去。GPT本身是閉源的,主要是做ChatGPT對(duì)話(huà)能力。我們?cè)趯?duì)齊方面要做得很好,上下文長(zhǎng)度可以做得很長(zhǎng),每個(gè)(大模型)既有雷同的地方又有自己的特色。”螞蟻集團(tuán)副總裁徐鵬此前接受第一財(cái)經(jīng)采訪(fǎng)時(shí)表示。
現(xiàn)在行業(yè)里面最大的問(wèn)題其實(shí)就是“太雷同了”,小冰公司CEO李笛同樣表示,目前各家公司都沿著同一條路徑往前走,缺乏多樣性,這與創(chuàng)新精神違背?!拔覀冇械臅r(shí)候認(rèn)為創(chuàng)新是追趕,其實(shí)創(chuàng)新不是追趕,而是有自己新的方法,去實(shí)現(xiàn)自己的優(yōu)勢(shì)?!?/p>
大模型之間的相似性也不難理解。
ChatGPT的驟然出現(xiàn),令許多企業(yè)措手不及。他們的首先目標(biāo)是觀(guān)察和了解,OpenAI是如何通過(guò)一個(gè)創(chuàng)業(yè)的團(tuán)隊(duì),做到令人吃驚的智能水平。它是人工智能荒野里的醒目坐標(biāo),其他企業(yè)現(xiàn)在能做的是,先追上這個(gè)目標(biāo)。
“中國(guó)還處于追趕的階段,很多東西在這個(gè)方面投入比較大,比如說(shuō)百度、騰訊、阿里等等都是先做到跟GPT類(lèi)似的水平?!毙禊i說(shuō),“但是我相信在這之后可以有很多創(chuàng)新的點(diǎn),可以做到不一樣的東西,只是現(xiàn)在這個(gè)階段還是處在追齊GPT能力的階段?!?/p>
重復(fù)造輪子的游戲不會(huì)一直持續(xù)下去,因?yàn)樗璧脑牧蠈?shí)在是太多,也太貴了,而且并非每個(gè)國(guó)家都能得到,并非每個(gè)企業(yè)都能支付高昂的價(jià)格。
“大模型它太貴了,恰恰因?yàn)樗F了,所以我覺(jué)得這件事情很快會(huì)走到一個(gè)好的路上,因?yàn)槟悴惶赡軣芫谩,F(xiàn)在大模型是一個(gè)2萬(wàn)張卡的游戲,而且這還不一定能看到結(jié)果。所以,我相信很快就會(huì)有變化。”李笛對(duì)記者說(shuō)。
現(xiàn)在大模型的運(yùn)算,嚴(yán)重依賴(lài)英偉達(dá)的GPU,以至于后者的價(jià)格已經(jīng)被炒高數(shù)倍。對(duì)于中國(guó)的大模型企業(yè),更難的一點(diǎn)在于,美國(guó)實(shí)施的出口禁令,已經(jīng)令英偉達(dá)的高性能芯片無(wú)法持續(xù)為中企所用。
李笛佩服的一家企業(yè)是任天堂,這家企業(yè)更善于充分利用現(xiàn)有技術(shù)。
任天堂、微軟和索尼是主機(jī)游戲的三大廠(chǎng)商。三家企業(yè)都有自己的主打硬件產(chǎn)品,以及為數(shù)眾多的游戲產(chǎn)品。任天堂的主打硬件平臺(tái)為Nintedo,微軟是Xbox,而索尼則是Playstation。
“跟微軟和索尼比起來(lái),任天堂不是堆最先進(jìn)的硬件,而是榨干成熟技術(shù)最后一點(diǎn)能力。這個(gè)很重要的,大模型也不能解決所有的事情,它離解決所有的事情還很遠(yuǎn),所以還是要靠整個(gè)系統(tǒng)不停幫它彌補(bǔ)?!崩畹驯硎尽?/p>
“做正確的選擇”
“現(xiàn)在很多吃大模型這碗飯的時(shí)候,大家做的都是偏雷同的”,在徐鵬看來(lái),還是要從應(yīng)用入手,說(shuō)不定更容易走出新路,“應(yīng)用是可以做出來(lái)非常多不一樣?xùn)|西的”。
這部分的原因在于開(kāi)源社區(qū)的發(fā)展。
在國(guó)外有開(kāi)源模型LIama和Llama2等,國(guó)內(nèi)也有阿里云的魔搭開(kāi)源社區(qū)等。開(kāi)源模型的存在,給應(yīng)用企業(yè)帶來(lái)了創(chuàng)新上的便利,而不用從頭開(kāi)始以大量的財(cái)力去訓(xùn)練基礎(chǔ)的模型。
“如果大家都把力量放在大模型應(yīng)用的創(chuàng)新上面,我覺(jué)得會(huì)讓我們看到大模型在什么地方,還有做得不到位的地方,還有很大的提升的空間,反過(guò)來(lái)促進(jìn)大模型技術(shù)的發(fā)展。”徐鵬表示,“我覺(jué)得應(yīng)該讓?xiě)?yīng)用的生態(tài)更加繁榮,這樣才能推動(dòng)模型的發(fā)展?,F(xiàn)在至少看起來(lái)應(yīng)用生態(tài)方面還不夠繁榮,應(yīng)用的場(chǎng)景還沒(méi)有那么豐富?!?/p>
John Roese在最近一場(chǎng)溝通會(huì)上表示,2024年的時(shí)候,生成式AI將從2023年的純理論的探討階段進(jìn)入到業(yè)務(wù)應(yīng)用階段。美國(guó)的Google、OpenAI以及國(guó)內(nèi)的阿里巴巴、百度等都陸續(xù)推出了生成式AI的技術(shù),但是還沒(méi)有多少客戶(hù)把它系統(tǒng)性地投入到實(shí)用中,而更多還是在理論探討的階段。
“今年有一些走得比較靠前的企業(yè),開(kāi)始對(duì)生成式AI做了各種各樣的實(shí)驗(yàn),在想清楚他們要怎樣去用,到2024年我們會(huì)看到真正轉(zhuǎn)變的到來(lái)”, John Roese說(shuō),現(xiàn)在大家已經(jīng)越來(lái)越懂得如何讓這些生成式AI進(jìn)入生產(chǎn)當(dāng)中,從理論階段進(jìn)入到業(yè)務(wù)應(yīng)用階段。
對(duì)于生成式AI,眾多科技企業(yè)都列出了長(zhǎng)長(zhǎng)的愿望清單,比如利用AI改變做財(cái)務(wù)的方式、人力資源管理的方式、雇傭人員的方式,編寫(xiě)代碼的方式以及銷(xiāo)售的模式?!按鳡柨萍技瘓F(tuán)就找到了380個(gè)項(xiàng)目能夠用上生成式AI的?!盝ohn Roese對(duì)記者說(shuō)。
但John Roese提醒,“現(xiàn)實(shí)是當(dāng)我們即將步入2024年的時(shí)候,要去實(shí)施生成式AI的時(shí)候會(huì)很快地認(rèn)識(shí)到,生成式AI的項(xiàng)目都非常大,需要占用大量的人力物力財(cái)力?!边@樣的話(huà),當(dāng)一家企業(yè)面臨上百項(xiàng),甚至是上千項(xiàng)選擇的時(shí)候,有限的資源投入哪些項(xiàng)目就是艱難的選擇。企業(yè)要根據(jù)生成式AI有多少人來(lái)用,多少人有訪(fǎng)問(wèn)權(quán)來(lái)決定投入的大小。是不是只有高管用,還是銷(xiāo)售人員、技術(shù)人員用,還是所有的客戶(hù)都能訪(fǎng)問(wèn)?這沒(méi)有標(biāo)準(zhǔn)的答案。
“每一個(gè)企業(yè)的資源有限,只能做其中的幾個(gè),比如說(shuō)選其中的3到4個(gè)來(lái)實(shí)施,所以明年CIO和企業(yè)的領(lǐng)導(dǎo)者必須做一個(gè)決定,在他們選出來(lái)的比如500個(gè)項(xiàng)目中有哪幾個(gè)要優(yōu)先實(shí)施。一旦優(yōu)先的項(xiàng)目選對(duì)了,對(duì)業(yè)務(wù)產(chǎn)生正向的影響當(dāng)然是好事;如果選錯(cuò)了,會(huì)出現(xiàn)大量的資源的浪費(fèi)。有些項(xiàng)目上投了生成式AI但又沒(méi)有產(chǎn)生效果,就會(huì)被競(jìng)爭(zhēng)對(duì)手甩到后面,這是很有風(fēng)險(xiǎn)的事情。”John Roese認(rèn)為,“明年我們要?jiǎng)澐州p重緩急,就是在所有可以用生成式AI的用例當(dāng)中哪幾個(gè)是優(yōu)先事項(xiàng),做正確的選擇。”
爆款不可求
企業(yè)把人工智能部署到內(nèi)部的時(shí)候,初始階段面臨的是難以估測(cè)的運(yùn)營(yíng)成本。
“明年隨著企業(yè)開(kāi)始使用這些科技,我們將會(huì)發(fā)現(xiàn)從訓(xùn)練成本到運(yùn)營(yíng)成本的轉(zhuǎn)變?!?/p>
John Roese介紹了一個(gè)戴爾的例子來(lái)說(shuō)明這個(gè)問(wèn)題。戴爾正在建立一個(gè)內(nèi)部系統(tǒng)的實(shí)驗(yàn)?zāi)P?,其中一個(gè)項(xiàng)目的訓(xùn)練需要花費(fèi)3個(gè)月左右的時(shí)間、用到至少20個(gè)服務(wù)器,以進(jìn)行系統(tǒng)調(diào)優(yōu)和優(yōu)化。在測(cè)試階段,整體運(yùn)營(yíng)成本是未知的,因?yàn)樵谙到y(tǒng)的部署階段,任何戴爾員工都可以向系統(tǒng)提問(wèn)任何關(guān)于產(chǎn)品和技術(shù)知識(shí)的問(wèn)題,而系統(tǒng)都會(huì)提供簡(jiǎn)練、充分的回答。但是戴爾的測(cè)試顯示:即便只將該系統(tǒng)開(kāi)放給應(yīng)用技術(shù)領(lǐng)域的大約6000員工,系統(tǒng)每月將會(huì)產(chǎn)生巨大的5000萬(wàn)左右的用戶(hù)互動(dòng)量。他因此認(rèn)為,在2024年,企業(yè)可能需要停止將成本投入放在建立模型或培訓(xùn)模型上,而是應(yīng)該開(kāi)始考慮在企業(yè)中“運(yùn)營(yíng)”一個(gè)大模型的成本。
“我們?cè)?024年將有可能看到許多針對(duì)該話(huà)題經(jīng)濟(jì)層面的討論。”John Roese表示,
“明年我們需要很好地審視一下,如果非常有用的話(huà),即使成本非常高,我們也愿意做?!?/p>
AI技術(shù)能否落地,對(duì)于使用者來(lái)說(shuō),關(guān)鍵是其投入產(chǎn)出比是否合適。
“還是要看一項(xiàng)應(yīng)用的最終商業(yè)效果,拿很大的算力陪別人聊天,掙不到錢(qián)的話(huà),沒(méi)有辦法回本,算力再多也不合理?!崩畹驯硎?。
目前為止在全球范圍內(nèi)缺乏成功的AI TO C的產(chǎn)品,也缺乏成功的TO B的產(chǎn)品。好的一面是,企業(yè)都有機(jī)會(huì)發(fā)現(xiàn)好的面向C端的AI產(chǎn)品,一個(gè)AI作為驅(qū)動(dòng)力的2B的產(chǎn)品也在等待著被發(fā)現(xiàn)。
創(chuàng)新的魅力也在于其不可預(yù)測(cè)性。
明年出現(xiàn)生成式AI爆款應(yīng)用,是可遇不可求的事情。從過(guò)往經(jīng)驗(yàn)來(lái)看,一些應(yīng)用短期沖上熱榜,獲得大量關(guān)注的可能性不小,但能夠持續(xù)成長(zhǎng)的產(chǎn)品則非常之少。
“我對(duì)于應(yīng)用的發(fā)展持著‘潤(rùn)物細(xì)無(wú)聲’的觀(guān)念,真正好的東西一定會(huì)出現(xiàn),但是可能不會(huì)突然之間成為爆款。它在擅長(zhǎng)的領(lǐng)域里一直在發(fā)展,一直帶來(lái)一些改變,這些改變積累到一定程度之后會(huì)成為所謂的爆款。”徐鵬說(shuō)。
技術(shù)變革到來(lái)的時(shí)候,站在最前沿的人常??床坏饺?。CTO們喜歡說(shuō),人們常常高估技術(shù)的短期收益,而低估其長(zhǎng)期影響。人工智能同樣如此。
“這樣一個(gè)大潮起來(lái)的時(shí)候,我們希望看清它到底帶來(lái)的東西是什么,它的能力邊界到底在什么地方,而不是盲目做太多不切實(shí)際的幻想。但是,又不能離開(kāi)這個(gè)幻想,因?yàn)橹挥谢孟氩庞袆?dòng)力,才有更多的人愿意去做一些看上去不靠譜的事情,”徐鵬認(rèn)為,應(yīng)該有一定的機(jī)制支持長(zhǎng)期投入,然后找到AI的核心應(yīng)用場(chǎng)景,找到它真正能夠帶來(lái)變化的東西。
技術(shù)的發(fā)展不是一飛沖天。人工智能發(fā)展史上,也經(jīng)歷過(guò)數(shù)次起落。這一輪生成式AI的發(fā)展恐怕也將如此,它會(huì)在某一個(gè)時(shí)間段出現(xiàn)停頓,然后“突然不知道誰(shuí)又解決行業(yè)里的難題,大家又一起繼續(xù)前進(jìn)。”李笛表示。