《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 智譜AI推出國產(chǎn)大模型GLM-4

智譜AI推出國產(chǎn)大模型GLM-4

性能比上代提升近60%,宣稱對標(biāo)美國GPT-4
2024-01-17
來源:鈦媒體
關(guān)鍵詞: 智譜 AI GLM-4 國產(chǎn)大模型

隨著OpenAI即將推出GPT-5,國內(nèi)人工智能(AI)大模型正加速追趕。

鈦媒體App 1月16日消息,阿里、騰訊投資的 AI 公司智譜 AI 在北京發(fā)布全新自研的第四代多模態(tài)基座大模型GLM-4系列,稱性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,“特別是中文能力可比肩GPT-4”,并且該公司還公布GLMs個性化智能體模型等產(chǎn)品。

同時,智譜AI今天還公布一項(xiàng)由智譜聯(lián)合生態(tài)伙伴發(fā)起的大模型創(chuàng)業(yè)基金“Z計劃”,總投入10億元人民幣,專門支持大模型原始創(chuàng)新,覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)大模型和超級應(yīng)用等方向。

智譜 AI 公司CEO張鵬表示,此次GLM-4的發(fā)布及上線,是智譜AI大模型研發(fā)上的關(guān)鍵突破。他強(qiáng)調(diào),為了瞄向AGI,公司每3-6個月更新一次做一次升級,上一代智譜解決的是模型能力矩陣的對標(biāo),這一次是模型能力上跟GPT-4做到基本對齊,“GLM-4的基本能力已經(jīng)比肩GPT-4?!?/p>

2.jpeg

據(jù)悉,智譜 AI 成立于2019年,脫胎于清華大學(xué)計算機(jī)系知識工程研究室團(tuán)隊,是清華大學(xué)知識成果轉(zhuǎn)化的創(chuàng)業(yè)公司,瞄準(zhǔn) AI 大模型研發(fā)落地,公司CEO張鵬畢業(yè)于清華計算機(jī)系,總裁王紹蘭為清華創(chuàng)新領(lǐng)軍博士,清華大學(xué)計算系教授唐杰也參與研發(fā)中國最大規(guī)模預(yù)訓(xùn)練模型悟道2.0。

2020年,智譜AI 開始啟動GLM預(yù)訓(xùn)練架構(gòu)的研發(fā),致力于打造新一代認(rèn)知智能大模型,專注于做大模型的中國創(chuàng)新,并訓(xùn)練出100億參數(shù)模型GLM-10B;2021年利用MoE架構(gòu)成功訓(xùn)練出萬億稀疏模型;2022年公布1300億級超大規(guī)模預(yù)訓(xùn)練通用模型GLM-130B,并以此打造大模型平臺及產(chǎn)品矩陣。

2023年初,智譜AI 推出千億基座的對話模型ChatGLM,并開源單卡版模型ChatGLM-6B等,部署于個人開發(fā)者和企業(yè)應(yīng)用領(lǐng)域。6月,智譜發(fā)布ChatGLM2,包括6B、130B、12B(120億參數(shù))、32B、66B等參數(shù)的模型,推理速度增長42%。據(jù)張鵬透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分別提升16%、36%和280%。

2023年10月,智譜 AI 公布ChatGLM3-1.5B、3B和6B(15億、30億、60億)參數(shù)版本,在多模態(tài)理解、代碼模塊、網(wǎng)絡(luò)搜索等能力上有所提升,而且相對最佳開源模型推理速度提升2-3倍。同時,基于集成自研AgentTuning技術(shù),在智能規(guī)劃和執(zhí)行上比ChatGLM-2提升1000%。另外,ChatGLM3還利用華為昇騰生態(tài),使算力推理速度提升3倍以上。同時,該公司也進(jìn)行商業(yè)化探索,打造AIGC(生成式 AI)模型及產(chǎn)品矩陣,包括已獲批上線的智譜清言、高效率代碼模型CodeGeeX等。

融資方面,創(chuàng)立至今的四年多,智譜AI 已完成四輪融資,投資方包括君聯(lián)資本、啟明創(chuàng)投、中科創(chuàng)星、美團(tuán)、螞蟻、阿里、騰訊、小米、金山、順為、Boss直聘、好未來、紅杉、高瓴等多家機(jī)構(gòu),去年融資額超過25億元人民幣。目前,智譜 AI 估值超過百億,是國內(nèi) AI 領(lǐng)域獨(dú)角獸企業(yè)。

公開信息顯示,截至目前,智譜 AI 開源模型在Hugging Face的全球下載量已超過1100萬次,GitHub累計有超過5萬Stars。

此次,智譜AI首屆技術(shù)開放日(Zhipu DevDay)上,主要公布三個重要消息:GLM-4系列多模態(tài)模型的發(fā)布,上線全新GLM-4的All Tools(所有工具)、GLMs個性化智能體定制能力,以及發(fā)起并聯(lián)合成立多個大模型開源基金、商業(yè)化進(jìn)展,從而拓寬智譜AI GLM系列模型生態(tài)。

首先是GLM-4系列模型。具體來說,GLM-4可支持128k的上下文窗口長度,單次提示詞可以處理的文本可以達(dá)到300頁。同時,它的推理速度更快,支持更高的并發(fā),大大降低推理成本,而且文生圖和多模態(tài)理解等方面都得到了一定增強(qiáng)。

據(jù)張鵬透露,在支持中文的文字寫作、數(shù)學(xué)計算、邏輯推理等AlignBench對齊能力基準(zhǔn)測試中,GLM-4達(dá)到GPT-4的95%-116%的水平;中英文的指令跟隨能力方面,GLM-4基本能達(dá)到GPT-4的80%左右水平;在支持總結(jié)、信息抽取、復(fù)雜推理能力的LongBench基準(zhǔn)測試中,GLM-4 128k版本達(dá)到81.1分,超過了GPT-4(71.2)。

3.jpeg

其次,GLM-4的All Tools是全新的智能體能力展示,可實(shí)現(xiàn)自主根據(jù)用戶意圖,自動理解、規(guī)劃復(fù)雜指令,能力完全自動,自由調(diào)用網(wǎng)頁瀏覽器、代碼解釋、多模態(tài)文生圖、文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù);GLMs個性化智能體定制功能則是支持用戶用簡單的提示詞指令創(chuàng)建屬于自己的GLM智能體,包括實(shí)現(xiàn)自動寫代碼、幫老師設(shè)計豐富有趣教學(xué)方案的教案設(shè)計師,或是能根據(jù)關(guān)鍵詞快速生成Logo的畫師等。

在會議現(xiàn)場,張鵬同時預(yù)告,GLMs 模型應(yīng)用商店開發(fā)者分成計劃也將同期公布。

最后是關(guān)于基金和生態(tài)部分,智譜AI共公布了四個基金項(xiàng)目:一、其聯(lián)合發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學(xué)科基金,去年為全國30余所高校參與的41個研究項(xiàng)目累計提供超過1000萬元資金和算力支持;二、今年智譜AI還發(fā)起大模型開源基金,提供1000張GPU卡、1000萬元現(xiàn)金支持、1000億免費(fèi)API tokens;三、智譜AI也將“Z計劃”進(jìn)一步升級,聯(lián)合生態(tài)伙伴發(fā)起總額10億元基金,支持大模型創(chuàng)業(yè)項(xiàng)目的創(chuàng)新探索,目前已公開投資了聆心智能、無問芯穹等項(xiàng)目。

商業(yè)化層面,目前智譜 AI GLM系列模型與德勤、火山引擎、蒙牛、中國電信、金山軟件、芒果TV、馬蜂窩、華泰證券等數(shù)十家公司合作,應(yīng)用于政務(wù)、金融、能源、制造、醫(yī)療等領(lǐng)域,支持10余種國產(chǎn)硬件生態(tài)。張鵬透露,除了To B端業(yè)務(wù)落地,未來智譜 AI 還將做To C端超級應(yīng)用,目的要把閉環(huán)做起來,給未來也留下一個可能性。

鈦媒體App了解到,目前智譜 AI 主要銷售三類技術(shù)服務(wù):數(shù)字人SaaS/PaaS方案,科技情報SaaS/PaaS方案,以及包括ChatGLM系列在內(nèi)的認(rèn)知大模型PaaS/MaaS平臺方案。

張鵬對外透露,2023年下半年,公司簽單客戶約有幾百家,2023年整體有億級簽單額。

對于中國大模型與GPT的差距,據(jù)騰訊新聞深網(wǎng),張鵬表示,目前兩者還處于追趕、縮小差距態(tài)勢,主要是國產(chǎn)大模型起步比OpenAI晚,因此需要不斷積累去調(diào)整發(fā)展速度、曲線的斜率,只有算法、系統(tǒng)工程、數(shù)據(jù)、應(yīng)用到落地等鏈條所有的創(chuàng)新累加起來,才有可能去超越GPT。

此前張鵬曾表示,在規(guī)模和核心能力上,國內(nèi)研發(fā)的大模型與世界先進(jìn)水平差距約一年左右。

中國科學(xué)院院士、清華大學(xué)教授張鈸卻認(rèn)為,大語言模型(LLM)仍存在不自知、質(zhì)量不可控、不可信、不魯棒(受提示詞影響)等問題,“幻覺”錯誤也很多。然而,盡管如此,但他卻依然支持大模型技術(shù)發(fā)展,他認(rèn)為 AI 產(chǎn)業(yè)發(fā)展一直受制于特定領(lǐng)域、特定模型和特定任務(wù)的限制,難以做大做強(qiáng),因此發(fā)展比較緩慢,而大模型給行業(yè)提供了發(fā)展通用硬件和軟件的更多機(jī)會。

“我想經(jīng)過2023年的充分競爭,現(xiàn)在我們逐漸可以說進(jìn)入一個決戰(zhàn)時刻了。”張鵬表示,智譜 AI 將希望與 AI 行業(yè)所有的參與者、產(chǎn)業(yè)鏈上下游合作伙伴、開發(fā)者社區(qū)、學(xué)術(shù)界一同努力,為中國 AI 未來發(fā)展貢獻(xiàn)綿薄之力。

weidian.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。