123,123

人工智能的2024：大模型太雷同，卷应用的时候到了

日期： 2024-01-03

來源：第一财经

關(guān)鍵詞： 人工智能大模型

“一年前，大部分的企業(yè)都沒有和大語言模型打過交道?！贝鳡柤瘓F(tuán)的首席技術(shù)官John Roese近期接受第一財經(jīng)采訪時表示，只有極少數(shù)的公司是例外。

現(xiàn)在大模型的進(jìn)展極快，不少公司都在擁抱它，尋找生成式AI的突破口。John Roese認(rèn)為明年會是生成式AI真正轉(zhuǎn)變到來的時候。與此同時，那些準(zhǔn)備在其業(yè)務(wù)中落地生成式AI的公司會發(fā)現(xiàn)，這項技術(shù)既可能用于財務(wù)、也可能用于售后，還可能用于編程等。每一項應(yīng)用都需要配置相當(dāng)多的資金和人力，不明智的選擇會帶來大量的資源浪費和時間成本，同時“會被競爭對手甩到后面，這是很有風(fēng)險的事情?！?/p>

OpenAI是人工智能曠野里醒目的坐標(biāo)，是其他企業(yè)模仿和追逐的對象，以至于業(yè)內(nèi)認(rèn)為現(xiàn)在的大模型都太雷同了。到了2024年，應(yīng)用端的突破也許比大模型本身更值得期待。

大模型“太雷同”

OpenAI打響了人工智能階段性突圍的一槍。

這之后，美國、中國等地的科技公司的恐懼和熱情都被激發(fā)出來了?？謶謥碜杂诒粫r代拋棄的風(fēng)險，熱情則來自于科技企業(yè)內(nèi)嵌的、對創(chuàng)新的追求。

美國參與大模型角逐的公司包括了科技巨頭如谷歌、Meta等，初創(chuàng)企業(yè)則有OpenAI、Anthropic等；中國則有百度、阿里等頭部科技企業(yè)，智譜、百川智能等初創(chuàng)公司。最熱鬧的時候，中國企業(yè)就發(fā)布了近百個大模型。

但在不少業(yè)內(nèi)人士看來，國內(nèi)外的大模型企業(yè)在做類似的工作。

“技術(shù)上面沒有本質(zhì)的區(qū)別，側(cè)重點不一樣，像Llama就是做一個通用的技術(shù)模型開源出去。GPT本身是閉源的，主要是做ChatGPT對話能力。我們在對齊方面要做得很好，上下文長度可以做得很長，每個（大模型）既有雷同的地方又有自己的特色。”螞蟻集團(tuán)副總裁徐鵬此前接受第一財經(jīng)采訪時表示。

現(xiàn)在行業(yè)里面最大的問題其實就是“太雷同了”，小冰公司CEO李笛同樣表示，目前各家公司都沿著同一條路徑往前走，缺乏多樣性，這與創(chuàng)新精神違背?！拔覀冇械臅r候認(rèn)為創(chuàng)新是追趕，其實創(chuàng)新不是追趕，而是有自己新的方法，去實現(xiàn)自己的優(yōu)勢。”

大模型之間的相似性也不難理解。

ChatGPT的驟然出現(xiàn)，令許多企業(yè)措手不及。他們的首先目標(biāo)是觀察和了解，OpenAI是如何通過一個創(chuàng)業(yè)的團(tuán)隊，做到令人吃驚的智能水平。它是人工智能荒野里的醒目坐標(biāo)，其他企業(yè)現(xiàn)在能做的是，先追上這個目標(biāo)。

“中國還處于追趕的階段，很多東西在這個方面投入比較大，比如說百度、騰訊、阿里等等都是先做到跟GPT類似的水平?！毙禊i說，“但是我相信在這之后可以有很多創(chuàng)新的點，可以做到不一樣的東西，只是現(xiàn)在這個階段還是處在追齊GPT能力的階段。”

重復(fù)造輪子的游戲不會一直持續(xù)下去，因為所需的原材料實在是太多，也太貴了，而且并非每個國家都能得到，并非每個企業(yè)都能支付高昂的價格。

“大模型它太貴了，恰恰因為它太貴了，所以我覺得這件事情很快會走到一個好的路上，因為你不太可能燒很久?，F(xiàn)在大模型是一個2萬張卡的游戲，而且這還不一定能看到結(jié)果。所以，我相信很快就會有變化?！崩畹褜τ浾哒f。

現(xiàn)在大模型的運算，嚴(yán)重依賴英偉達(dá)的GPU，以至于后者的價格已經(jīng)被炒高數(shù)倍。對于中國的大模型企業(yè)，更難的一點在于，美國實施的出口禁令，已經(jīng)令英偉達(dá)的高性能芯片無法持續(xù)為中企所用。

李笛佩服的一家企業(yè)是任天堂，這家企業(yè)更善于充分利用現(xiàn)有技術(shù)。

任天堂、微軟和索尼是主機游戲的三大廠商。三家企業(yè)都有自己的主打硬件產(chǎn)品，以及為數(shù)眾多的游戲產(chǎn)品。任天堂的主打硬件平臺為Nintedo，微軟是Xbox，而索尼則是Playstation。

“跟微軟和索尼比起來，任天堂不是堆最先進(jìn)的硬件，而是榨干成熟技術(shù)最后一點能力。這個很重要的，大模型也不能解決所有的事情，它離解決所有的事情還很遠(yuǎn)，所以還是要靠整個系統(tǒng)不停幫它彌補?！崩畹驯硎?。

“做正確的選擇”

“現(xiàn)在很多吃大模型這碗飯的時候，大家做的都是偏雷同的”，在徐鵬看來，還是要從應(yīng)用入手，說不定更容易走出新路，“應(yīng)用是可以做出來非常多不一樣?xùn)|西的”。

這部分的原因在于開源社區(qū)的發(fā)展。

在國外有開源模型LIama和Llama2等，國內(nèi)也有阿里云的魔搭開源社區(qū)等。開源模型的存在，給應(yīng)用企業(yè)帶來了創(chuàng)新上的便利，而不用從頭開始以大量的財力去訓(xùn)練基礎(chǔ)的模型。

“如果大家都把力量放在大模型應(yīng)用的創(chuàng)新上面，我覺得會讓我們看到大模型在什么地方，還有做得不到位的地方，還有很大的提升的空間，反過來促進(jìn)大模型技術(shù)的發(fā)展。”徐鵬表示，“我覺得應(yīng)該讓應(yīng)用的生態(tài)更加繁榮，這樣才能推動模型的發(fā)展。現(xiàn)在至少看起來應(yīng)用生態(tài)方面還不夠繁榮，應(yīng)用的場景還沒有那么豐富?！?/p>

John Roese在最近一場溝通會上表示，2024年的時候，生成式AI將從2023年的純理論的探討階段進(jìn)入到業(yè)務(wù)應(yīng)用階段。美國的Google、OpenAI以及國內(nèi)的阿里巴巴、百度等都陸續(xù)推出了生成式AI的技術(shù)，但是還沒有多少客戶把它系統(tǒng)性地投入到實用中，而更多還是在理論探討的階段。

“今年有一些走得比較靠前的企業(yè)，開始對生成式AI做了各種各樣的實驗，在想清楚他們要怎樣去用，到2024年我們會看到真正轉(zhuǎn)變的到來”， John Roese說，現(xiàn)在大家已經(jīng)越來越懂得如何讓這些生成式AI進(jìn)入生產(chǎn)當(dāng)中，從理論階段進(jìn)入到業(yè)務(wù)應(yīng)用階段。

對于生成式AI，眾多科技企業(yè)都列出了長長的愿望清單，比如利用AI改變做財務(wù)的方式、人力資源管理的方式、雇傭人員的方式，編寫代碼的方式以及銷售的模式?！按鳡柨萍技瘓F(tuán)就找到了380個項目能夠用上生成式AI的?！盝ohn Roese對記者說。

但John Roese提醒，“現(xiàn)實是當(dāng)我們即將步入2024年的時候，要去實施生成式AI的時候會很快地認(rèn)識到，生成式AI的項目都非常大，需要占用大量的人力物力財力。”這樣的話，當(dāng)一家企業(yè)面臨上百項，甚至是上千項選擇的時候，有限的資源投入哪些項目就是艱難的選擇。企業(yè)要根據(jù)生成式AI有多少人來用，多少人有訪問權(quán)來決定投入的大小。是不是只有高管用，還是銷售人員、技術(shù)人員用，還是所有的客戶都能訪問？這沒有標(biāo)準(zhǔn)的答案。

“每一個企業(yè)的資源有限，只能做其中的幾個，比如說選其中的3到4個來實施，所以明年CIO和企業(yè)的領(lǐng)導(dǎo)者必須做一個決定，在他們選出來的比如500個項目中有哪幾個要優(yōu)先實施。一旦優(yōu)先的項目選對了，對業(yè)務(wù)產(chǎn)生正向的影響當(dāng)然是好事；如果選錯了，會出現(xiàn)大量的資源的浪費。有些項目上投了生成式AI但又沒有產(chǎn)生效果，就會被競爭對手甩到后面，這是很有風(fēng)險的事情?！盝ohn Roese認(rèn)為，“明年我們要劃分輕重緩急，就是在所有可以用生成式AI的用例當(dāng)中哪幾個是優(yōu)先事項，做正確的選擇?！?/p>

爆款不可求

企業(yè)把人工智能部署到內(nèi)部的時候，初始階段面臨的是難以估測的運營成本。

“明年隨著企業(yè)開始使用這些科技，我們將會發(fā)現(xiàn)從訓(xùn)練成本到運營成本的轉(zhuǎn)變?！?/p>

John Roese介紹了一個戴爾的例子來說明這個問題。戴爾正在建立一個內(nèi)部系統(tǒng)的實驗?zāi)Ｐ?，其中一個項目的訓(xùn)練需要花費3個月左右的時間、用到至少20個服務(wù)器，以進(jìn)行系統(tǒng)調(diào)優(yōu)和優(yōu)化。在測試階段，整體運營成本是未知的，因為在系統(tǒng)的部署階段，任何戴爾員工都可以向系統(tǒng)提問任何關(guān)于產(chǎn)品和技術(shù)知識的問題，而系統(tǒng)都會提供簡練、充分的回答。但是戴爾的測試顯示：即便只將該系統(tǒng)開放給應(yīng)用技術(shù)領(lǐng)域的大約6000員工，系統(tǒng)每月將會產(chǎn)生巨大的5000萬左右的用戶互動量。他因此認(rèn)為，在2024年，企業(yè)可能需要停止將成本投入放在建立模型或培訓(xùn)模型上，而是應(yīng)該開始考慮在企業(yè)中“運營”一個大模型的成本。

“我們在2024年將有可能看到許多針對該話題經(jīng)濟(jì)層面的討論?！盝ohn Roese表示，

“明年我們需要很好地審視一下，如果非常有用的話，即使成本非常高，我們也愿意做?！?/p>

AI技術(shù)能否落地，對于使用者來說，關(guān)鍵是其投入產(chǎn)出比是否合適。

“還是要看一項應(yīng)用的最終商業(yè)效果，拿很大的算力陪別人聊天，掙不到錢的話，沒有辦法回本，算力再多也不合理。”李笛表示。

目前為止在全球范圍內(nèi)缺乏成功的AI TO C的產(chǎn)品，也缺乏成功的TO B的產(chǎn)品。好的一面是，企業(yè)都有機會發(fā)現(xiàn)好的面向C端的AI產(chǎn)品，一個AI作為驅(qū)動力的2B的產(chǎn)品也在等待著被發(fā)現(xiàn)。

創(chuàng)新的魅力也在于其不可預(yù)測性。

明年出現(xiàn)生成式AI爆款應(yīng)用，是可遇不可求的事情。從過往經(jīng)驗來看，一些應(yīng)用短期沖上熱榜，獲得大量關(guān)注的可能性不小，但能夠持續(xù)成長的產(chǎn)品則非常之少。

“我對于應(yīng)用的發(fā)展持著‘潤物細(xì)無聲’的觀念，真正好的東西一定會出現(xiàn)，但是可能不會突然之間成為爆款。它在擅長的領(lǐng)域里一直在發(fā)展，一直帶來一些改變，這些改變積累到一定程度之后會成為所謂的爆款。”徐鵬說。

技術(shù)變革到來的時候，站在最前沿的人常?？床坏饺?。CTO們喜歡說，人們常常高估技術(shù)的短期收益，而低估其長期影響。人工智能同樣如此。

“這樣一個大潮起來的時候，我們希望看清它到底帶來的東西是什么，它的能力邊界到底在什么地方，而不是盲目做太多不切實際的幻想。但是，又不能離開這個幻想，因為只有幻想才有動力，才有更多的人愿意去做一些看上去不靠譜的事情，”徐鵬認(rèn)為，應(yīng)該有一定的機制支持長期投入，然后找到AI的核心應(yīng)用場景，找到它真正能夠帶來變化的東西。

技術(shù)的發(fā)展不是一飛沖天。人工智能發(fā)展史上，也經(jīng)歷過數(shù)次起落。這一輪生成式AI的發(fā)展恐怕也將如此，它會在某一個時間段出現(xiàn)停頓，然后“突然不知道誰又解決行業(yè)里的難題，大家又一起繼續(xù)前進(jìn)?！崩畹驯硎尽?/p>

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

人工智能的2024：大模型太雷同，卷应用的时候到了

日期： 2024-01-03

來源：第一财经

相關(guān)內(nèi)容