123,123

爆火的月之暗面国产大模型Kimi实测

公司为宕机致歉

日期： 2024-03-22

來(lái)源：第一财经

關(guān)鍵詞： 月之暗面 Kimi 国产大模型

是中國(guó)版ChatGPT的討論從未消失，在一眾“大哥”面前，一家創(chuàng)業(yè)公司被視為最有力的挑戰(zhàn)者，旗下名為“Kimi”的應(yīng)用甚至成為了資本市場(chǎng)的新寵。

站在Kimi背后的是一家叫做月之暗面的公司，該公司3月18日宣布，Kimi 智能助手在長(zhǎng)上下文窗口技術(shù)上再次取得突破，無(wú)損上下文長(zhǎng)度提升了一個(gè)數(shù)量級(jí)到200萬(wàn)字。而在此前，GPT-4Turbo-128k公布的數(shù)字約10萬(wàn)漢字，Claude3200k上下文約16萬(wàn)漢字。

長(zhǎng)上下文意味著什么？實(shí)際能力如何？第一財(cái)經(jīng)記者征求了業(yè)內(nèi)人士的意見(jiàn)并實(shí)測(cè)了Kimi和通義千問(wèn)等國(guó)產(chǎn)大模型產(chǎn)品。

Kimi為“宕機(jī)”致歉

21日下午，月之暗面旗下大模型應(yīng)用kimi的APP和小程序均無(wú)法正常使用。此前，月之暗面發(fā)布情況說(shuō)明：從2024.3.209:30:00開(kāi)始，觀測(cè)到Kimi的系統(tǒng)流量持續(xù)異常增高，流量增加的趨勢(shì)遠(yuǎn)超對(duì)資源的預(yù)期規(guī)劃。這導(dǎo)致了從2024.3.2010:00:00開(kāi)始，有較多的SaaS客戶(hù)持續(xù)的體驗(yàn)到429:engine is overloaded的異常問(wèn)題，并對(duì)此表示深表抱歉。

在一個(gè)Kimi團(tuán)隊(duì)與用戶(hù)溝通的群里，Kimi方面人員表示，“Kimi從昨天開(kāi)始用戶(hù)量增速很快，工程師已經(jīng)緊急擴(kuò)容了幾次，還在實(shí)施更多應(yīng)急措施。”Kimi訪問(wèn)量的激增讓這家公司的網(wǎng)絡(luò)一度陷入癱瘓。

公開(kāi)資料顯示，月之暗面由90后楊植麟創(chuàng)立，成立于2023年3月1日，目前已完成三筆融資。今年2月，該公司完成一筆大額融資，以15億美元投前估值完成超10億美元B輪，阿里領(lǐng)投，礪思資本、小紅書(shū)跟投，投后估值約25億美元，是國(guó)內(nèi)最主要的大模型獨(dú)角獸之一。

長(zhǎng)文本無(wú)損壓縮是上述公司瞄準(zhǔn)的一個(gè)方向。據(jù)楊植麟介紹，長(zhǎng)文本作為公司“登月”的第一步，是新的計(jì)算機(jī)內(nèi)存，很本質(zhì)，個(gè)性化并非通過(guò)微調(diào)實(shí)現(xiàn)，上下文定義了個(gè)性化過(guò)程。楊植麟還認(rèn)為，大模型“馬拉松剛開(kāi)始，接下來(lái)會(huì)有更多差異化”。

在20萬(wàn)漢字的基礎(chǔ)上，Kimi又將上下文長(zhǎng)度提升至200萬(wàn)。關(guān)于長(zhǎng)度提升后有何變化，21日，月之暗面相關(guān)負(fù)責(zé)人告訴第一財(cái)經(jīng)記者，這會(huì)進(jìn)一步幫助打開(kāi)對(duì)AI應(yīng)用場(chǎng)景的想象力，包括完整代碼庫(kù)分析理解、可自主幫人類(lèi)完成多步驟復(fù)雜任務(wù)的智能體Agent、不會(huì)遺忘關(guān)鍵信息的終身助理、真正統(tǒng)一架構(gòu)的多模態(tài)模型等。

“簡(jiǎn)單來(lái)說(shuō)，文本長(zhǎng)度長(zhǎng)就可以跟AI一直對(duì)話，AI不會(huì)‘遺忘’之前的對(duì)話內(nèi)容，還能有比較好的理解。同時(shí)，一個(gè)項(xiàng)目代碼可達(dá)幾百萬(wàn)行，如果大模型支持的文本長(zhǎng)度不夠長(zhǎng)，就沒(méi)法理解并輔助工作?！庇蠭T人員向記者解釋。

就“長(zhǎng)文本是否是未來(lái)競(jìng)爭(zhēng)的一個(gè)差異化方向，抑或大模型廠商都在共同追逐的目標(biāo)，長(zhǎng)文本意味著什么？”的問(wèn)題，一名大廠大模型研究人員告訴記者，目前判斷一個(gè)大模型是否強(qiáng)大，還是基于指定評(píng)估數(shù)據(jù)集和用戶(hù)日常聊天體驗(yàn)，但文本長(zhǎng)度普遍有限，這限制了商業(yè)價(jià)值。在實(shí)際應(yīng)用中，很多時(shí)候需要考慮的是需處理的巨大信息量。如果大模型能解決長(zhǎng)文本問(wèn)題，潛在價(jià)值是巨大的，例如投喂財(cái)務(wù)數(shù)據(jù)輸出完整財(cái)報(bào)、投喂大量病例情況讓大模型幫助解決醫(yī)學(xué)問(wèn)題。

“但值得注意的是，長(zhǎng)文本擴(kuò)展并不一定意味著實(shí)際效果足夠好，還需要有足夠理解能力以及對(duì)人類(lèi)指令的遵循能力，文本之外，圖像及文本大模型有更多token需要處理，需要足夠長(zhǎng)的上下文能力支持。除文本的長(zhǎng)上下文外，要實(shí)現(xiàn)AGI（通用人工智能）還需要有同時(shí)處理時(shí)空物多維度信息的能力?！鄙鲜鲅芯繂T說(shuō)。

而對(duì)于目前“與哪些上市公司展開(kāi)合作”的問(wèn)題，月之暗面并沒(méi)有正面回復(fù)。該公司負(fù)責(zé)人對(duì)記者表示，其開(kāi)放平臺(tái)是面向所有開(kāi)發(fā)者和企業(yè)用戶(hù)開(kāi)放的，任何合規(guī)的開(kāi)發(fā)者和企業(yè)都可以將 Kimi 智能助手背后的同款大模型API接入到自己的產(chǎn)品或服務(wù)中，基于 Kimi 大模型卓越的長(zhǎng)文本處理和指令遵循能力，升級(jí)或打造新的產(chǎn)品或服務(wù)。

國(guó)內(nèi)大模型哪家強(qiáng)？

國(guó)內(nèi)大模型發(fā)展至今，不少應(yīng)用已經(jīng)逐步走入C端，但國(guó)產(chǎn)大模型理解能力如何？能理解長(zhǎng)文本并給出高質(zhì)量回答嗎？第一財(cái)經(jīng)記者今日實(shí)測(cè)了包括Kimi、智譜清言、通義千問(wèn)等國(guó)內(nèi)幾大主流大模型產(chǎn)品。

在評(píng)測(cè)后，記者發(fā)現(xiàn)，一些大模型還不支持長(zhǎng)文本輸入或不支持較大的文檔上傳，Kimi、通義千問(wèn)在解讀財(cái)報(bào)、研報(bào)、論文方面的能力較好，但Kimi有時(shí)會(huì)因“高峰時(shí)段忙碌而暫不回復(fù)”，智譜清言則犯過(guò)將非上市公司列入股票行列的錯(cuò)誤，文心一言對(duì)諸如選股、找最新報(bào)告的要求有時(shí)不直接回應(yīng)且出現(xiàn)過(guò)核心信息遺漏問(wèn)題。

為測(cè)試對(duì)較長(zhǎng)且較專(zhuān)業(yè)文本的理解和信息提取能力，記者還實(shí)測(cè)了Kimi和其他國(guó)內(nèi)大模型在提取論文和研報(bào)信息的能力。

近日騰訊與清華大學(xué)、香港科技大學(xué)聯(lián)合發(fā)布了一個(gè)圖生視頻模型，記者將該模型相關(guān)英文論文交給Kimi和通義千問(wèn)、文心一言、智譜清言和訊飛星火，要求分析核心內(nèi)容和論文實(shí)現(xiàn)方法，Kimi和通義千問(wèn)都給出詳細(xì)解答。其中，Kimi點(diǎn)明論文貢獻(xiàn)、相關(guān)模型的框架和實(shí)現(xiàn)的關(guān)鍵步驟，關(guān)鍵詞匯還附帶英文名詞標(biāo)注，通義千問(wèn)除了實(shí)現(xiàn)方法外，還解答了實(shí)驗(yàn)方面研究者如何進(jìn)行評(píng)估。此外，將論文發(fā)給訊飛星火app后，訊飛星火給出較短的文檔摘要，但不如Kimi和通義千問(wèn)詳細(xì)清晰，且訊飛星火對(duì)記者的提問(wèn)表示“在文檔中沒(méi)有找到與提問(wèn)相關(guān)的內(nèi)容”，訊飛星火網(wǎng)頁(yè)端對(duì)20M以上文檔上傳則有限制。

此外，智譜清言限制上傳文件大小，記者希望上傳的論文超過(guò)10M限制，記者復(fù)制論文內(nèi)容至對(duì)話框，但很快也超過(guò)限制字?jǐn)?shù)，無(wú)法發(fā)出文字與AI對(duì)話。文心一言同樣限制文檔大小且限制對(duì)話框文字長(zhǎng)度，導(dǎo)致無(wú)法對(duì)文檔進(jìn)行分析。

對(duì)于哪個(gè)國(guó)產(chǎn)大模型能讀懂研報(bào)并給出投資建議？記者將兩份不同券商發(fā)布的關(guān)于人形機(jī)器人行業(yè)的研報(bào)交給Kimi、通義千問(wèn)、訊飛星火、文心一言、智譜清言，其中一份長(zhǎng)達(dá)50頁(yè)，記者要求大模型分析哪些機(jī)器人股票比較有潛力，并要求挑出兩只可考慮買(mǎi)的股票。

測(cè)試結(jié)果顯示，Kimi和訊飛星火均給出10家有潛力的個(gè)股并分析原因，記者追問(wèn)“如果要挑兩只股票買(mǎi)，哪兩只比較好”，Kimi和訊飛星火給出了兩只個(gè)股并解釋原因，同時(shí)提醒股票投資風(fēng)險(xiǎn)或建議咨詢(xún)財(cái)務(wù)顧問(wèn)意見(jiàn)。通義千問(wèn)則按產(chǎn)業(yè)鏈不同環(huán)節(jié)分列20余只有較高投資潛力的個(gè)股并解釋原因，根據(jù)研報(bào)資料挑選出兩只股票，同樣給出投資風(fēng)險(xiǎn)提示并建議尋求專(zhuān)業(yè)投資顧問(wèn)的意見(jiàn)。值得注意的是，通義千問(wèn)和Kimi挑出的兩只股票中，有一只是相同的，Kimi和訊飛星火挑選出的兩只股票也有一只是相同的。

即便是給出了風(fēng)險(xiǎn)提示，但這樣的結(jié)果也讓部分券商分析師感到不安?！叭绻麑⒏拍罟傻男畔⑼ㄟ^(guò)某些渠道加大投喂力度，這是否會(huì)引起搜索結(jié)果的導(dǎo)向出現(xiàn)偏差，引發(fā)較高的投資風(fēng)險(xiǎn)，目前不得而知。”某分析師說(shuō)。

從記者評(píng)測(cè)的結(jié)果看，智譜清言給出5只潛力比較大的個(gè)股中，其列出的公司中有一家并未上市。文心一言則表示，產(chǎn)業(yè)鏈一些環(huán)節(jié)的公司具有潛力，但沒(méi)有列出具體個(gè)股并逐個(gè)說(shuō)明原因，且未直接回復(fù)“買(mǎi)哪兩只股票好”的問(wèn)題，而是列出通用的選股策略。

在財(cái)報(bào)解讀方面，第一財(cái)經(jīng)記者將B站2023年財(cái)報(bào)PDF文檔（700kb）上傳至大模型對(duì)話窗口，并讓AI幫忙解讀財(cái)報(bào)的核心內(nèi)容。隨后，Kimi分段給出了財(cái)務(wù)摘要數(shù)據(jù)和管理層評(píng)論，列出了凈營(yíng)業(yè)額、廣告業(yè)務(wù)收入等主要財(cái)務(wù)數(shù)據(jù)；智譜給出了一段財(cái)務(wù)數(shù)據(jù)內(nèi)容，且是原文繁體字，沒(méi)有轉(zhuǎn)成簡(jiǎn)體中文，而其他家都給出簡(jiǎn)體中文的回復(fù)；通義千問(wèn)則分段給出了財(cái)務(wù)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、業(yè)務(wù)亮點(diǎn)與戰(zhàn)略執(zhí)行、成本與開(kāi)支控制等內(nèi)容，從財(cái)報(bào)內(nèi)容解讀的全面性和有用性方面來(lái)說(shuō)，較為突出；文心一言給出了不同業(yè)務(wù)的營(yíng)收數(shù)據(jù)，但核心信息凈虧損有遺漏，其他大模型沒(méi)有出現(xiàn)這個(gè)遺漏。

記者隨后試圖同時(shí)上傳2022年與2023年兩份年報(bào)讓AI對(duì)比，智譜清言、文心一言?xún)H支持上傳一份文檔，Kimi試了幾次都顯示輸出失敗，表示“和Kimi聊的人太多，Kimi有點(diǎn)累了”；通義千問(wèn)給出了兩份年報(bào)的核心變化，提到了關(guān)鍵的日活破億、毛利率提升、成本結(jié)構(gòu)改善以及虧損收窄，表現(xiàn)較為突出。

翻譯場(chǎng)景上，記者以前段時(shí)間Sora的技術(shù)文檔為例，其中涉及不少技術(shù)名詞，讓AI進(jìn)行翻譯。記者先直接發(fā)送網(wǎng)頁(yè)鏈接讓AI翻譯，Kimi仍然輸出失敗，通義千問(wèn)和文心一言不支持網(wǎng)頁(yè)翻譯；智譜支持網(wǎng)頁(yè)翻譯，但只翻譯了部分核心內(nèi)容，記者進(jìn)一步要求其翻譯全文，AI回復(fù)稱(chēng)“由于版權(quán)和長(zhǎng)度限制，無(wú)法提供完整的翻譯”。

隨后記者復(fù)制了部分關(guān)鍵內(nèi)容考驗(yàn)各家大模型的翻譯能力，從輸出結(jié)果看，對(duì)于大模型訓(xùn)練（training）、擴(kuò)散模型（diffusionmodels）、LLM、patch這些專(zhuān)業(yè)名詞，相比翻譯器來(lái)說(shuō)，各個(gè)大模型都表現(xiàn)得更加智能，但從閱讀流暢性、智能分段這種指標(biāo)來(lái)說(shuō)，智譜略微勝出。

如果要輔助工作學(xué)習(xí)，這些大模型能起到多大作用？為測(cè)試這個(gè)能力，記者向Kimi、通義千問(wèn)、文心一言提出“查詢(xún)關(guān)于深度學(xué)習(xí)的最新研究報(bào)告”的要求，結(jié)果顯示，Kimi能給出較好回復(fù)，但還不是非常“新”，其他兩個(gè)模型未給出對(duì)應(yīng)內(nèi)容。Kimi提供的具體報(bào)告內(nèi)容鏈接中，三篇中的兩篇來(lái)自2022年——一則來(lái)自知乎，一則來(lái)自新華網(wǎng)，還有另一篇來(lái)自《計(jì)算機(jī)應(yīng)用研究》，未有明確時(shí)間標(biāo)注。此外，通義千問(wèn)回復(fù)“作為離線助手，無(wú)法實(shí)時(shí)查詢(xún)互聯(lián)網(wǎng)上的最新深度學(xué)習(xí)研究報(bào)告”，并給出幾項(xiàng)學(xué)術(shù)期刊、學(xué)術(shù)會(huì)議推薦。文心一言直接從引言、算法創(chuàng)新、模型優(yōu)化、應(yīng)用場(chǎng)景拓展、市場(chǎng)與產(chǎn)業(yè)分析等角度給出歸納，但并不符合“最新研報(bào)”的訴求。

涉及日常生活的建議，Kimi、通義千問(wèn)和文心一言給出答案的差距則不太大。記者提出“一位30歲、60KG、165cm的女性想要達(dá)到健身目標(biāo)，該如何進(jìn)行鍛煉計(jì)劃制定”的問(wèn)題，Kimi、通義千問(wèn)、文心一言均從目標(biāo)、鍛煉計(jì)劃、飲食、休息等幾方面給出全方位建議。

能趕上GPT4嗎？

Kimi“引爆”概念股，一定程度上顯現(xiàn)資本市場(chǎng)對(duì)國(guó)產(chǎn)大模型能力躍進(jìn)的期待。此外，近期國(guó)產(chǎn)大模型密集發(fā)布，廠商最頻繁使用的一個(gè)詞匯是“逼近”，強(qiáng)調(diào)自身技術(shù)實(shí)力“逼近GPT4”。資本市場(chǎng)聞風(fēng)而動(dòng)、大模型密集發(fā)布背后，國(guó)產(chǎn)大模型能趕上GPT4了嗎？

一位人工智能行業(yè)人士對(duì)記者表示，由于目前大模型企業(yè)之間并無(wú)明確的對(duì)比項(xiàng)目，大多通過(guò)打榜的形式來(lái)佐證自身實(shí)力，因此無(wú)法通過(guò)嚴(yán)謹(jǐn)?shù)牡谌綌?shù)據(jù)來(lái)區(qū)分廠商之間的技術(shù)差距，但可以明確的是，自從OpenAI將GPT4閉源后，國(guó)內(nèi)廠商與其差距目前仍較大。

多名業(yè)內(nèi)人士也提到過(guò)國(guó)內(nèi)廠商與硅谷廠商之間的差距。智象未來(lái)創(chuàng)始人兼CEO、加拿大工程院外籍院士梅濤表示，從通用大模型的角度來(lái)說(shuō)，中國(guó)廠商與硅谷廠商之間的差距有被拉大的風(fēng)險(xiǎn)，原因包括人才密度問(wèn)題、資源問(wèn)題。2023年，中國(guó)初創(chuàng)公司做通用大模型的公司用一千張卡的資源來(lái)對(duì)標(biāo)ChatGPT3.5，今年則用萬(wàn)張卡級(jí)別資源對(duì)標(biāo)ChatGPT4，而硅谷目前已經(jīng)考慮十萬(wàn)級(jí)甚至百萬(wàn)級(jí)的卡做對(duì)應(yīng)的事情，對(duì)比缺口比較大。

相對(duì)來(lái)講，梅濤認(rèn)為多模態(tài)生成式領(lǐng)域的對(duì)比差距相對(duì)好一點(diǎn)，不論是Sora還是Midjourney，這個(gè)領(lǐng)域生成式模型基本上參數(shù)都在百億級(jí)規(guī)模左右，該規(guī)模搭配千張卡左右的資源，創(chuàng)業(yè)公司通過(guò)早期融資還是可以實(shí)現(xiàn)的。對(duì)這個(gè)差距沒(méi)有那么大的領(lǐng)域，梅濤認(rèn)為中國(guó)企業(yè)應(yīng)優(yōu)先考慮的是如何在產(chǎn)業(yè)化方面做好產(chǎn)品迭代以及商業(yè)化，這些角度中國(guó)廠商很有可能比國(guó)外企業(yè)更快更敏捷。

瀾舟科技創(chuàng)始人兼CEO周明認(rèn)為，目前中國(guó)在大模型算法上原創(chuàng)技術(shù)能力并不差，但在頂層設(shè)計(jì)上可以跟美國(guó)學(xué)習(xí)，或比美國(guó)做得更好。周明認(rèn)為國(guó)內(nèi)缺乏一個(gè)國(guó)家機(jī)制或聯(lián)盟體來(lái)定義一個(gè)大模型未來(lái)發(fā)展的必要趨勢(shì)。這個(gè)問(wèn)題一旦解決，中國(guó)的人才便可以快速攻關(guān)，雖然算力不足的問(wèn)題尚存在，但通過(guò)算法或應(yīng)用發(fā)力，可以彌補(bǔ)算力不足的問(wèn)題。

此外，周明認(rèn)為國(guó)內(nèi)大模型企業(yè)要跟國(guó)家的發(fā)展大趨勢(shì)配合，而非一味去與美國(guó)相關(guān)企業(yè)看齊。他稱(chēng)，很多國(guó)內(nèi)大模型企業(yè)只知與美國(guó)企業(yè)看齊，亦步亦趨，后者提出一個(gè)技術(shù)點(diǎn)，國(guó)內(nèi)便想要跟上或進(jìn)行改良。更合適的動(dòng)作應(yīng)從綜合趨勢(shì)上進(jìn)行推進(jìn)，最為重要的是應(yīng)用驅(qū)動(dòng)。中國(guó)大模型相關(guān)企業(yè)與美國(guó)企業(yè)相比，在應(yīng)用場(chǎng)景等方面雖然沒(méi)有大的優(yōu)勢(shì)，但也不占劣勢(shì)。如果在場(chǎng)景和應(yīng)用角度去反向驅(qū)動(dòng)各個(gè)應(yīng)用，推動(dòng)國(guó)家經(jīng)濟(jì)和生產(chǎn)力各個(gè)方面提升，中國(guó)基礎(chǔ)創(chuàng)新能力有可能在下一輪 AI 創(chuàng)新中引領(lǐng)國(guó)際潮流。

談及近一年人工智能領(lǐng)域的動(dòng)態(tài)，中關(guān)村數(shù)智人工智能產(chǎn)業(yè)聯(lián)盟理事長(zhǎng)，原小米集團(tuán)副總裁崔寶秋是興奮的，他稱(chēng)，看好大數(shù)據(jù)和深度學(xué)習(xí)帶來(lái)新一代AI技術(shù)的快速發(fā)展。從時(shí)間線上來(lái)看，一年多前大模型的發(fā)布仍存在“胡說(shuō)八道”的問(wèn)題，讓人感覺(jué)很不靠譜。但在2023年，崔寶秋去到美國(guó)，接觸大模型最新技術(shù)前沿，令他感受到新的時(shí)代到來(lái)，雖然大模型技術(shù)目前是美國(guó)引領(lǐng)，但中國(guó)企業(yè)也在快速跟進(jìn)。

梅濤近一年也在頻繁往返中國(guó)與美國(guó)硅谷，在他看來(lái)，最新的體感就是中美生態(tài)確實(shí)不太一樣，例如在投融資方面，不管是融資還是公司的估值方面，中美企業(yè)之間的差距是巨大的，特別是融資的環(huán)境，希望今年有所改變。

另外，雖說(shuō)2024年是創(chuàng)新元年，但就遍地是黃金嗎？周明認(rèn)為不是，國(guó)內(nèi)大模型領(lǐng)域很多地方都沒(méi)有開(kāi)拓出來(lái)，比如大模型如何結(jié)合最后一公里、大模型的商業(yè)模式是什么、如何加強(qiáng)交付能力、提高產(chǎn)品的標(biāo)準(zhǔn)化，這些才剛剛開(kāi)始，方興未艾。

雜志訂閱.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

爆火的月之暗面国产大模型Kimi实测

日期： 2024-03-22

來(lái)源：第一财经

相關(guān)內(nèi)容