“一年前,大部分的企業(yè)都沒有和大語言模型打過交道?!贝鳡柤瘓F的首席技術(shù)官John Roese近期接受第一財經(jīng)采訪時表示,只有極少數(shù)的公司是例外。
現(xiàn)在大模型的進展極快,不少公司都在擁抱它,尋找生成式AI的突破口。John Roese認為明年會是生成式AI真正轉(zhuǎn)變到來的時候。與此同時,那些準備在其業(yè)務(wù)中落地生成式AI的公司會發(fā)現(xiàn),這項技術(shù)既可能用于財務(wù)、也可能用于售后,還可能用于編程等。每一項應(yīng)用都需要配置相當多的資金和人力,不明智的選擇會帶來大量的資源浪費和時間成本,同時“會被競爭對手甩到后面,這是很有風險的事情。”
OpenAI是人工智能曠野里醒目的坐標,是其他企業(yè)模仿和追逐的對象,以至于業(yè)內(nèi)認為現(xiàn)在的大模型都太雷同了。到了2024年,應(yīng)用端的突破也許比大模型本身更值得期待。
大模型“太雷同”
OpenAI打響了人工智能階段性突圍的一槍。
這之后,美國、中國等地的科技公司的恐懼和熱情都被激發(fā)出來了。恐懼來自于被時代拋棄的風險,熱情則來自于科技企業(yè)內(nèi)嵌的、對創(chuàng)新的追求。
美國參與大模型角逐的公司包括了科技巨頭如谷歌、Meta等,初創(chuàng)企業(yè)則有OpenAI、Anthropic等;中國則有百度、阿里等頭部科技企業(yè),智譜、百川智能等初創(chuàng)公司。最熱鬧的時候,中國企業(yè)就發(fā)布了近百個大模型。
但在不少業(yè)內(nèi)人士看來,國內(nèi)外的大模型企業(yè)在做類似的工作。
“技術(shù)上面沒有本質(zhì)的區(qū)別,側(cè)重點不一樣,像Llama就是做一個通用的技術(shù)模型開源出去。GPT本身是閉源的,主要是做ChatGPT對話能力。我們在對齊方面要做得很好,上下文長度可以做得很長,每個(大模型)既有雷同的地方又有自己的特色?!蔽浵伡瘓F副總裁徐鵬此前接受第一財經(jīng)采訪時表示。
現(xiàn)在行業(yè)里面最大的問題其實就是“太雷同了”,小冰公司CEO李笛同樣表示,目前各家公司都沿著同一條路徑往前走,缺乏多樣性,這與創(chuàng)新精神違背?!拔覀冇械臅r候認為創(chuàng)新是追趕,其實創(chuàng)新不是追趕,而是有自己新的方法,去實現(xiàn)自己的優(yōu)勢?!?/p>
大模型之間的相似性也不難理解。
ChatGPT的驟然出現(xiàn),令許多企業(yè)措手不及。他們的首先目標是觀察和了解,OpenAI是如何通過一個創(chuàng)業(yè)的團隊,做到令人吃驚的智能水平。它是人工智能荒野里的醒目坐標,其他企業(yè)現(xiàn)在能做的是,先追上這個目標。
“中國還處于追趕的階段,很多東西在這個方面投入比較大,比如說百度、騰訊、阿里等等都是先做到跟GPT類似的水平?!毙禊i說,“但是我相信在這之后可以有很多創(chuàng)新的點,可以做到不一樣的東西,只是現(xiàn)在這個階段還是處在追齊GPT能力的階段?!?/p>
重復(fù)造輪子的游戲不會一直持續(xù)下去,因為所需的原材料實在是太多,也太貴了,而且并非每個國家都能得到,并非每個企業(yè)都能支付高昂的價格。
“大模型它太貴了,恰恰因為它太貴了,所以我覺得這件事情很快會走到一個好的路上,因為你不太可能燒很久?,F(xiàn)在大模型是一個2萬張卡的游戲,而且這還不一定能看到結(jié)果。所以,我相信很快就會有變化。”李笛對記者說。
現(xiàn)在大模型的運算,嚴重依賴英偉達的GPU,以至于后者的價格已經(jīng)被炒高數(shù)倍。對于中國的大模型企業(yè),更難的一點在于,美國實施的出口禁令,已經(jīng)令英偉達的高性能芯片無法持續(xù)為中企所用。
李笛佩服的一家企業(yè)是任天堂,這家企業(yè)更善于充分利用現(xiàn)有技術(shù)。
任天堂、微軟和索尼是主機游戲的三大廠商。三家企業(yè)都有自己的主打硬件產(chǎn)品,以及為數(shù)眾多的游戲產(chǎn)品。任天堂的主打硬件平臺為Nintedo,微軟是Xbox,而索尼則是Playstation。
“跟微軟和索尼比起來,任天堂不是堆最先進的硬件,而是榨干成熟技術(shù)最后一點能力。這個很重要的,大模型也不能解決所有的事情,它離解決所有的事情還很遠,所以還是要靠整個系統(tǒng)不停幫它彌補。”李笛表示。
“做正確的選擇”
“現(xiàn)在很多吃大模型這碗飯的時候,大家做的都是偏雷同的”,在徐鵬看來,還是要從應(yīng)用入手,說不定更容易走出新路,“應(yīng)用是可以做出來非常多不一樣?xùn)|西的”。
這部分的原因在于開源社區(qū)的發(fā)展。
在國外有開源模型LIama和Llama2等,國內(nèi)也有阿里云的魔搭開源社區(qū)等。開源模型的存在,給應(yīng)用企業(yè)帶來了創(chuàng)新上的便利,而不用從頭開始以大量的財力去訓(xùn)練基礎(chǔ)的模型。
“如果大家都把力量放在大模型應(yīng)用的創(chuàng)新上面,我覺得會讓我們看到大模型在什么地方,還有做得不到位的地方,還有很大的提升的空間,反過來促進大模型技術(shù)的發(fā)展?!毙禊i表示,“我覺得應(yīng)該讓應(yīng)用的生態(tài)更加繁榮,這樣才能推動模型的發(fā)展?,F(xiàn)在至少看起來應(yīng)用生態(tài)方面還不夠繁榮,應(yīng)用的場景還沒有那么豐富?!?/p>
John Roese在最近一場溝通會上表示,2024年的時候,生成式AI將從2023年的純理論的探討階段進入到業(yè)務(wù)應(yīng)用階段。美國的Google、OpenAI以及國內(nèi)的阿里巴巴、百度等都陸續(xù)推出了生成式AI的技術(shù),但是還沒有多少客戶把它系統(tǒng)性地投入到實用中,而更多還是在理論探討的階段。
“今年有一些走得比較靠前的企業(yè),開始對生成式AI做了各種各樣的實驗,在想清楚他們要怎樣去用,到2024年我們會看到真正轉(zhuǎn)變的到來”, John Roese說,現(xiàn)在大家已經(jīng)越來越懂得如何讓這些生成式AI進入生產(chǎn)當中,從理論階段進入到業(yè)務(wù)應(yīng)用階段。
對于生成式AI,眾多科技企業(yè)都列出了長長的愿望清單,比如利用AI改變做財務(wù)的方式、人力資源管理的方式、雇傭人員的方式,編寫代碼的方式以及銷售的模式?!按鳡柨萍技瘓F就找到了380個項目能夠用上生成式AI的?!盝ohn Roese對記者說。
但John Roese提醒,“現(xiàn)實是當我們即將步入2024年的時候,要去實施生成式AI的時候會很快地認識到,生成式AI的項目都非常大,需要占用大量的人力物力財力。”這樣的話,當一家企業(yè)面臨上百項,甚至是上千項選擇的時候,有限的資源投入哪些項目就是艱難的選擇。企業(yè)要根據(jù)生成式AI有多少人來用,多少人有訪問權(quán)來決定投入的大小。是不是只有高管用,還是銷售人員、技術(shù)人員用,還是所有的客戶都能訪問?這沒有標準的答案。
“每一個企業(yè)的資源有限,只能做其中的幾個,比如說選其中的3到4個來實施,所以明年CIO和企業(yè)的領(lǐng)導(dǎo)者必須做一個決定,在他們選出來的比如500個項目中有哪幾個要優(yōu)先實施。一旦優(yōu)先的項目選對了,對業(yè)務(wù)產(chǎn)生正向的影響當然是好事;如果選錯了,會出現(xiàn)大量的資源的浪費。有些項目上投了生成式AI但又沒有產(chǎn)生效果,就會被競爭對手甩到后面,這是很有風險的事情。”John Roese認為,“明年我們要劃分輕重緩急,就是在所有可以用生成式AI的用例當中哪幾個是優(yōu)先事項,做正確的選擇?!?/p>
爆款不可求
企業(yè)把人工智能部署到內(nèi)部的時候,初始階段面臨的是難以估測的運營成本。
“明年隨著企業(yè)開始使用這些科技,我們將會發(fā)現(xiàn)從訓(xùn)練成本到運營成本的轉(zhuǎn)變?!?/p>
John Roese介紹了一個戴爾的例子來說明這個問題。戴爾正在建立一個內(nèi)部系統(tǒng)的實驗?zāi)P?,其中一個項目的訓(xùn)練需要花費3個月左右的時間、用到至少20個服務(wù)器,以進行系統(tǒng)調(diào)優(yōu)和優(yōu)化。在測試階段,整體運營成本是未知的,因為在系統(tǒng)的部署階段,任何戴爾員工都可以向系統(tǒng)提問任何關(guān)于產(chǎn)品和技術(shù)知識的問題,而系統(tǒng)都會提供簡練、充分的回答。但是戴爾的測試顯示:即便只將該系統(tǒng)開放給應(yīng)用技術(shù)領(lǐng)域的大約6000員工,系統(tǒng)每月將會產(chǎn)生巨大的5000萬左右的用戶互動量。他因此認為,在2024年,企業(yè)可能需要停止將成本投入放在建立模型或培訓(xùn)模型上,而是應(yīng)該開始考慮在企業(yè)中“運營”一個大模型的成本。
“我們在2024年將有可能看到許多針對該話題經(jīng)濟層面的討論?!盝ohn Roese表示,
“明年我們需要很好地審視一下,如果非常有用的話,即使成本非常高,我們也愿意做。”
AI技術(shù)能否落地,對于使用者來說,關(guān)鍵是其投入產(chǎn)出比是否合適。
“還是要看一項應(yīng)用的最終商業(yè)效果,拿很大的算力陪別人聊天,掙不到錢的話,沒有辦法回本,算力再多也不合理。”李笛表示。
目前為止在全球范圍內(nèi)缺乏成功的AI TO C的產(chǎn)品,也缺乏成功的TO B的產(chǎn)品。好的一面是,企業(yè)都有機會發(fā)現(xiàn)好的面向C端的AI產(chǎn)品,一個AI作為驅(qū)動力的2B的產(chǎn)品也在等待著被發(fā)現(xiàn)。
創(chuàng)新的魅力也在于其不可預(yù)測性。
明年出現(xiàn)生成式AI爆款應(yīng)用,是可遇不可求的事情。從過往經(jīng)驗來看,一些應(yīng)用短期沖上熱榜,獲得大量關(guān)注的可能性不小,但能夠持續(xù)成長的產(chǎn)品則非常之少。
“我對于應(yīng)用的發(fā)展持著‘潤物細無聲’的觀念,真正好的東西一定會出現(xiàn),但是可能不會突然之間成為爆款。它在擅長的領(lǐng)域里一直在發(fā)展,一直帶來一些改變,這些改變積累到一定程度之后會成為所謂的爆款?!毙禊i說。
技術(shù)變革到來的時候,站在最前沿的人常??床坏饺?。CTO們喜歡說,人們常常高估技術(shù)的短期收益,而低估其長期影響。人工智能同樣如此。
“這樣一個大潮起來的時候,我們希望看清它到底帶來的東西是什么,它的能力邊界到底在什么地方,而不是盲目做太多不切實際的幻想。但是,又不能離開這個幻想,因為只有幻想才有動力,才有更多的人愿意去做一些看上去不靠譜的事情,”徐鵬認為,應(yīng)該有一定的機制支持長期投入,然后找到AI的核心應(yīng)用場景,找到它真正能夠帶來變化的東西。
技術(shù)的發(fā)展不是一飛沖天。人工智能發(fā)展史上,也經(jīng)歷過數(shù)次起落。這一輪生成式AI的發(fā)展恐怕也將如此,它會在某一個時間段出現(xiàn)停頓,然后“突然不知道誰又解決行業(yè)里的難題,大家又一起繼續(xù)前進?!崩畹驯硎?。