在 AI 邁向“端邊云協(xié)同”的新時代,大模型的價值不僅在于云端的超強算力,更在于能否高效、低成本地部署到千行百業(yè)的終端設備中。
近日,阿里通義大模型與達摩院旗下玄鐵 RISC-V 宣布將基于開源架構的優(yōu)勢,深度融合,正式推出“Powered by XuanTie,Qwen Inside”技術戰(zhàn)略——通義大模型算法與基于開源 RISC-V 架構的玄鐵處理器將通過軟硬全鏈路協(xié)同優(yōu)化,實現(xiàn)通義大模型家族在 RISC-V 架構上的極致高效部署和推理性能,從端到云以嶄新硬件形態(tài),承載智能能力。未來,雙方將進一步實現(xiàn)“模型即服務,芯片即載體”,攜手生態(tài)伙伴打造下一代超級智能硬件,真正實現(xiàn) AI 普惠。

玄鐵持續(xù)深耕 RISC-V 架構的前沿技術創(chuàng)新及開源生態(tài)建設,推出能夠滿足高中低性能需求的玄鐵全系列處理器,覆蓋包括智能終端、網(wǎng)絡通訊、AI 智算、服務器及周邊等多個行業(yè)場景。通義大模型自發(fā)布以來,已發(fā)布覆蓋語言理解、代碼生成、多模態(tài)感知、語音交互等多個技術方向的產(chǎn)品,通過前沿 AI 技術,打造安全、可靠、普惠的通用人工智能能力。
過去,大模型部署到端側常面臨算力不足、功耗高、軟件棧不兼容等難題。此次合作覆蓋通義大模型家族全系列,包括超大規(guī)模 Qwen-Max 、輕量化模型 Qwen-Turbo、多模態(tài)模型 Qwen-VL、語音模型 Qwen-Audio 等全棧產(chǎn)品。RISC-V 的開放性、模塊化設計、硬件擴展能力、并行計算支持以及低功耗特性,非常適合 AI 應用的需求。如今,在端側芯片設計階段就將通義的計算圖、算子需求、內存訪問模式“前置注入”玄鐵微架構,實現(xiàn)了算法與硬件的原生匹配——不僅大幅提升推理效率,更顯著降低部署門檻。

“開源 RISC-V 架構為硬件設計提供了天然適配 AI 的算力基座。這無疑為不斷迭代的大模型、日趨多樣的智能體以及不斷蝶變激增的算力需求,帶來了革新方案。”通義大模型業(yè)務經(jīng)理徐棟進一步解釋道:“無論是基于 RVV 加速的語言交互系統(tǒng)架構優(yōu)化,推動實現(xiàn)端到端訓練及實時與端側整體優(yōu)化的可能;還是得益于 RISC-V AME 獨立矩陣引擎,能夠充分完成 Qwen3-VL的全鏈路異質任務,支撐極致吞吐,讓圖像識別走向認知;更能持續(xù)推動 RISC-V 多模態(tài)推理持續(xù)突破新高度,讓圖像推理超越識別,不止于認知。我們相信「開源 x 開源」的通義原生 AI Core,會激發(fā)更大潛能!”
“我們不是簡單地將大模型塞進設備,而是從端側芯片底層開始,為大模型‘量身定制’計算底座。例如,我們將 Qwen3-Omni 模型輕量化部署到搭載玄鐵處理器的 RISC-V 端側芯片上,僅用單一模型完成全流程處理,在體積縮小 40%、成本降低 30% 的同時,帶來更流暢、更智能的交互體驗?!毙F團隊負責人表示,“‘玄鐵 + 通義’的深度融合,也標志著一條‘開源芯 + 大模型’的全棧技術路徑正在形成,讓 AI 有望成為工廠、學校、社區(qū)和家庭中每一個智能終端的標配能力?!?/p>
過去一年,玄鐵再度實現(xiàn)技術躍升,發(fā)布面向服務器場景的高性能旗艦處理器 C930, 集成 512-bit RVV1.0 向量引擎與 8 TOPS Matrix 矩陣雙引擎,并開放 DSA 擴展接口,滿足多樣化高性能計算需求,在 SPECint2006 基準測試中通用算力性能達 15/GHz,目前已在服務器、AI、邊緣計算等關鍵場景進行規(guī)?;渴稹?/p>
玄鐵 C908X 作為玄鐵旗下首款 AI 專用處理器,兼容 64 位 RVV1.0 架構設計,支持同構多核多 Cluster,可提供從 512 到 4096 位的超寬矢量指令,并通過預置 AI 加速指令實現(xiàn)AI 運算加速,助力用戶利用 RVV 進行矩陣計算、稀疏計算及非 Tensor 核的特殊計算。通過擴展矢量寬度,C908X 可提供最大 1TOPS/Core/GHz 算力并支持多種 AI 算子庫,從而加速 AI 部署及大模型部署。同年,基于 C908X 處理器,玄鐵發(fā)布面向端側智能場景的全棧 RISC-V AI 方案,構建了覆蓋端側、邊緣側到云側的完整軟硬件生態(tài),可應對多樣化的 AI 計算需求,為邊緣 AI 推理、智能駕駛、工業(yè)自動化和智能終端等場景,提供強有力的支持,滿足低延時長續(xù)航、高精度推理、高效數(shù)據(jù)處理等業(yè)務需求。
面對 AI 等新興場景對定制化算力的迫切需求,玄鐵創(chuàng)新推出全新 Flex 系列可擴展平臺,開創(chuàng)“通用 IP + 自定義加速”雙軌模式??蛻艏瓤芍苯硬捎酶呖煽康男F處理器 IP,亦可基于 Flex 提供的全套軟硬件框架(含處理器建模、開發(fā)環(huán)境及工具鏈)打造專屬加速器。經(jīng)實測,基于 Flex-C 定制的處理器相較通用版本最高可實現(xiàn) 10 倍性能提升。目前,F(xiàn)lex 系列已與高性能 C 系列無縫兼容,并將逐步拓展至嵌入式 E 系列與實時控制 R 系列,全面覆蓋多元應用場景。

未來,雙方將持續(xù)開放玄鐵 IP 與通義大模型的協(xié)同工具鏈,攜手端側芯片廠商、整機企業(yè)與行業(yè) ISV,借助 RISC-V 自身的智能架構優(yōu)勢,推動“Qwen Inside”走進機器人、工業(yè)控制、車載終端、端側智能、服務器及周邊等萬千場景,讓大模型真正“落地生根”,賦能千行百業(yè)智能化升級。
Powered by XuanTie, 基于開源的創(chuàng)新加速時代,正式到來!

