90% 的 AI 設(shè)備都是用 Arm 的架構(gòu)設(shè)計的,現(xiàn)在 Arm 在人工智能領(lǐng)域厚積薄發(fā),發(fā)布了 Trillium 項目,包括一款為移動設(shè)備而設(shè)計的機器學習處理器、一款目標檢測處理器和一個神經(jīng)網(wǎng)絡(luò)軟件庫。
現(xiàn)在 90% 的 AI 設(shè)備都是基于 Arm 架構(gòu)開發(fā)的,Arm 是一家英國芯片知識產(chǎn)權(quán)提供商,以 CPU 和 GPU 處理器而被熟知。為了提高機器學習的影響力,今天這家公司宣布了 Trillium 項目,包括一個機器學習處理器、一個目標檢測處理器,和一個神經(jīng)網(wǎng)絡(luò)軟件庫的 Arm IP 套件。
Trillium 項目是這家公司在人工智能領(lǐng)域極富雄心的一次舉措,通過集成設(shè)計提升 AI 設(shè)備的效率和性能,預(yù)計到 2028 年,這些設(shè)備的數(shù)量將從現(xiàn)在的 3 億增長到 32 億。
Arm 在機器學習領(lǐng)域的努力可以追溯到 2013 年,那時它開始探索 AI 市場并實施了一系列的戰(zhàn)略收購。2017 年,這家公司宣布建立機器學習事業(yè)群,并任命 Jem Davies 擔任總經(jīng)理。在一次獨家專訪中,Davies 告訴 Synced 他認為「沒有一個細分市場還沒有或者不會被 AI 所沖擊」。
「AI 幾乎影響所有……手機、相機、智能音箱,甚至溫度控制器。誰會想到房間溫度控制器是一個智能裝置呢?」Davies 說。
今天發(fā)布的機器學習芯片是 Arm 的第一代針對移動設(shè)備推斷的 AI 芯片。該芯片使移動設(shè)備每平方毫米的運算性能不低于每秒 4.6 萬億次,在現(xiàn)實優(yōu)化應(yīng)用中實現(xiàn) 2 到 4 倍的吞吐量提升,以及在熱度和能耗有限的環(huán)境里也能夠?qū)崿F(xiàn)超過 3 TOPs/W 的效率。
Davies 說其機器學習處理器背后的架構(gòu)是全新的,根植于多年的研究成果。該架構(gòu)為 16 位整數(shù)運算進行了優(yōu)化。
新架構(gòu)將為 CPU 和 GPU 遇到的挑戰(zhàn)提供解決方案,Davies 說?!妇矸e神經(jīng)網(wǎng)絡(luò)非常普遍。重點是傳統(tǒng)架構(gòu),不管是 CPU、GPU 還是 DSP,都要進行大量中間結(jié)果存儲和加載。因此,我們生產(chǎn)了一種全新的架構(gòu),該架構(gòu)使用智能存儲系統(tǒng)?!?/p>
目標檢測處理器是基于 Arm 現(xiàn)有的 IP 族 Spirit 的迭代。Spirit 是主導(dǎo) Hive 安防攝像頭的目標檢測加速器,于 2016 年 Arm 收購 Apical 后不久發(fā)布,Apical 是一家為超過 15 億設(shè)備提供計算機視覺和圖像處理器的公司。
Arm 的第二代處理器可以全高清、60fps 實時檢測無限數(shù)量的目標。其詳細的人體模型提供了豐富的元數(shù)據(jù),使方向、軌跡、姿勢和動作檢測成為可能。
Arm 提供集成解決方案,包括機器學習處理器和目標檢測處理器。在實時目標識別任務(wù)中,目標檢測處理器首先分離出感興趣區(qū)域,比如人臉。這樣,機器學習處理器就能夠分析更少的像素,以實現(xiàn)更快、更精細的結(jié)果。
Arm 的組合解決方案。
Arm 的神經(jīng)網(wǎng)絡(luò)庫是一系列圖像、視覺和機器學習工作負載構(gòu)造塊的集合。開發(fā)者可使用該軟件,以及 Arm 現(xiàn)有的實現(xiàn)工具,如加速算法和應(yīng)用的 Compute Library,或最大化邊緣設(shè)備上性能的 CMSIS-NN。該庫支持主流框架,如 TensorFlow、Caffe,且已經(jīng)為 Arm Cortex CPU、Mali GPU 和新型機器學習處理器進行了優(yōu)化。
Arm 機器學習處理器將于今夏發(fā)售,目標檢測處理器將于本季度末上市。