《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 安謀科技“周易”X3 NPU IP軟硬協(xié)同開發(fā)效率倍增

安謀科技“周易”X3 NPU IP軟硬協(xié)同開發(fā)效率倍增

2025-11-17
來源:安謀科技
關鍵詞: 安謀科技 NPU AI

2025年11月13日,國內(nèi)領先的芯片IP設計與服務提供商安謀科技Arm China在上海隆重舉行新品發(fā)布會,正式推出新一代NPU IP“周易”X3?;谡嬲饬x上的軟硬協(xié)同設計,在提供高性能硬件基石與完善易用工具生態(tài)的同時,以“All in AI”為產(chǎn)品戰(zhàn)略指引,為各行各業(yè)的智能化轉(zhuǎn)型注入強勁的“核芯”動力。 

11.jpg


一、架構(gòu)革新:面向大模型時代的原生設計

安謀科技Arm China 的“周易”X3采用革命性的DSP+DSA混合架構(gòu),兼顧CNN與Transformer等主流模型,全面支持從int4到fp32的多精度融合計算與強浮點運算能力,并集成端側(cè)大模型必備的W4A8/W4A16計算加速模式。其單Cluster可實現(xiàn)8–80 FP8 TFLOPS靈活配置,單核心帶寬高達256GB/s。通過集成自研解壓硬件WDC,“周易”X3支持對模型權重進行無損壓縮后直接硬件解壓,帶來額外15%–20%的等效帶寬提升,有效緩解內(nèi)存墻壓力。

性能方面,“周易”X3在處理CNN模型時性能較前代提升30%–50%,同算力下AIGC大模型處理能力提升高達10倍。多核協(xié)同算力線性度達到70%–80%,算力利用率顯著優(yōu)化。在實際大模型推理中,“周易”X3在Prefill階段算力利用率達72%,在Decode階段結(jié)合WDC技術,有效帶寬利用率突破100%,遠超行業(yè)平均水平。可廣泛應用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機、智能網(wǎng)關、智能IPC等終端設備,覆蓋基礎設施、智能汽車、移動終端與智能物聯(lián)網(wǎng)等關鍵領域。

12.jpg


二、生態(tài)協(xié)同:Compass AI平臺推動開發(fā)效率倍增

“周易”NPU Compass AI軟件平臺的卓越之處在于覆蓋開發(fā)全流程的有機整體,通過極致的易用性優(yōu)化與開放生態(tài)布局,精準解決開發(fā)痛點。其核心神經(jīng)網(wǎng)絡編譯器(NN Compiler)集成了模型解析器(Parser)、優(yōu)化器(Optimizer)、生成器(GBuilder)及大模型運行工具(AIPULLM),構(gòu)建出高效的自動化模型轉(zhuǎn)化與部署流水線,具備五大核心能力:

一是廣泛的框架與模型支持,兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流框架,支持超160種算子與270種模型,并提供開箱即用的Model Zoo,助力項目快速啟動。

二是創(chuàng)新的Hugging Face模型“一鍵部署”,通過AIPULLM工具鏈實現(xiàn)一站式轉(zhuǎn)化與部署,大幅降低大模型端側(cè)應用門檻。

三是先進的模型推理優(yōu)化,支持業(yè)界領先的大模型動態(tài)shape,可高效處理任意長度輸入序列;提供Tensor/Channel/Token級多樣化量化方案及GPTQ等主流量化技術,在保障精度的同時實現(xiàn)模型壓縮加速,并強化對LLM、VLM、VLA及MoE等前沿模型的高性能支持,確保云到端平滑遷移。

四是靈活的開發(fā)者賦能,提供開放接口支持自定義算子開發(fā)與調(diào)試,配備豐富調(diào)試工具及Bit精度仿真平臺,實現(xiàn)多層次白盒開發(fā)與性能調(diào)優(yōu),極大簡化算法移植。

五是全面的系統(tǒng)與異構(gòu)兼容,支持Android、Linux、RTOS、QNX等多操作系統(tǒng),通過TVM/ONNX實現(xiàn)SoC異構(gòu)計算,高效調(diào)度CPU、GPU、NPU等計算資源,最大化算力利用。

13.jpg


三、開放開源:構(gòu)建共創(chuàng)共榮的開發(fā)者生態(tài)

安謀科技Arm China深刻認識到,開放是技術進步的催化劑。因此,其正積極構(gòu)建一個開放的生態(tài)體系。Compass AI軟件平臺中的Parser、Optimizer、Linux Driver、TVM及內(nèi)部IR格式等核心組件已相繼開源。

這一舉措不僅滿足了開發(fā)者進行白盒化部署的需求,更賦予了他們更深度的定制能力。開發(fā)者不僅可以利用平臺提供的Compiler、Debugger或更易用的DSL算子編程語言來開發(fā)自定義算子,甚至可以基于開源的Parser、Optimizer等工具,打造出專屬于自己業(yè)務場景的模型編譯器,從而實現(xiàn)真正的差異化設計,并進一步提升開發(fā)效率。


14.jpg


四、軟硬協(xié)同:從芯片到場景的極致優(yōu)化

“周易”X3 NPU IP與Compass AI的協(xié)同優(yōu)勢,并非簡單的硬件與軟件捆綁,而是源于安謀科技的精心構(gòu)思與反復論證,以提升客戶最終落地方案的效率和能效。

在硬件端,安謀科技充分考慮了軟件的實際使用場景,通過增大總線帶寬、增加DMA的outstanding能力等方式,顯著提升了數(shù)據(jù)搬運效率和數(shù)據(jù)并行處理能力,從硬件底層為高性能計算掃清了數(shù)據(jù)通路障礙。在軟件端,Compass AI則針對這些硬件特性設計了專屬的使用模式。

這種深度的、從指令集到應用層的軟硬件協(xié)同設計,使得“周易”X3 NPU IP和Compass AI平臺形成了一個緊密耦合、相互促進的有機整體,最終轉(zhuǎn)化為客戶產(chǎn)品在真實世界應用中更快的響應速度、更低的功耗消耗及更順暢的開發(fā)體驗。

15.jpg


結(jié)語

總而言之,安謀科技Arm China“周易”X3 NPU IP與Compass AI軟件平臺,通過其全棧的、軟硬協(xié)同的解決方案,成功地構(gòu)建了一個從易用性到高性能、從開放生態(tài)到深度定制的完整閉環(huán)。它不僅僅是一套工具,更是賦能千行百業(yè)擁抱端側(cè)智能的橋梁與引擎。隨著該平臺的持續(xù)演進與生態(tài)的不斷壯大,它必將成為推動AI技術在億萬終端設備上普惠化、平民化發(fā)展的關鍵力量,開啟一個萬物智能時代高效開發(fā)的新篇章。


訂閱網(wǎng)站文章尾圖1.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。