人工智能已經(jīng)成為目前芯片行業(yè)的一個重要驅(qū)動力。回顧人工智能在半導(dǎo)體行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進(jìn)路線。
最初,人工智能主要是作為一種服務(wù)部署在云端。本代人工智能基于大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò),因此在訓(xùn)練時候需要大量的算力,在云端部署的時候也需要算力做支撐,因此云端人工智能領(lǐng)域中以Nvidia為代表的GPU加速人工智能成為了關(guān)注焦點(diǎn),同時也有以Graphcore、Habana為代表的云端專用人工智能芯片公司與GPU分庭抗禮。2018年之后,隨著模型和芯片設(shè)計(jì)的優(yōu)化,人工智能逐漸從云端下沉到手機(jī)等強(qiáng)智能設(shè)備終端,在手機(jī)上基于人工智能算法的超分辨、美顏、人臉識別等應(yīng)用也漸漸得到了主流認(rèn)可,相應(yīng)的芯片(IP)也就成為了手機(jī)SoC上不可或缺的一部分,高通、蘋果、華為海思等都擁有自己的高性能人工智能加速IP,用以支持手機(jī)人工智能應(yīng)用。
而隨著人工智能技術(shù)的進(jìn)一步演進(jìn),我們看到它正在進(jìn)一步和物聯(lián)網(wǎng)結(jié)合,超低功耗人工智能正是這個人工智能繼續(xù)下沉的新動向。
超低功耗人工智能芯片的應(yīng)用場景
超低功耗人工智能芯片(IP)的工作功耗在數(shù)十毫瓦或更低(作為比較,手機(jī)端人工智能IP的工作功耗往往在數(shù)百毫瓦到瓦級別,而云端人工智能加速卡功耗通常在數(shù)百瓦),同時往往結(jié)合事件驅(qū)動技術(shù),即絕大部分時間計(jì)算部分都處于休眠狀態(tài),僅僅在發(fā)生相關(guān)事件時才會啟動,這樣就可以把平均功耗降低到毫瓦數(shù)量級以下。
超低功耗人工智能可以應(yīng)用在什么場景下呢?消費(fèi)電子領(lǐng)域中就有超低功耗人工智能的一席之地。在下一代智能設(shè)備如可穿戴設(shè)備和智能眼鏡類設(shè)備中,設(shè)備由于尺寸等原因電池容量有限,而這些設(shè)備需要執(zhí)行智能生物信號處理(例如智能手表上的心率檢測)、手勢識別(例如在目前的HoloLens中,基于人工智能的手勢識別是主要用戶交互方式)、語音識別等等,因此需要非常高能效比的人工智能加速模塊。除此之外,在智能家庭等領(lǐng)域,超低功耗人工智能也有落地機(jī)會,例如目前的智能門鎖市場,加入人臉識別會使智能門鎖的用戶體驗(yàn)大大改善,但是智能門鎖通常必須依靠電池供電,而且預(yù)期的電池壽命至少要半年到一年,這樣一來對于執(zhí)行人工智能計(jì)算的模塊就提出了非常高的能效比需求。
除了消費(fèi)電子之外,工業(yè)應(yīng)用中也需要超低功耗人工智能。工業(yè)應(yīng)用中對于超低功耗人工智能的需求往往來源于智能傳感器。這類傳感器安裝在機(jī)器、機(jī)械臂、管道等重要環(huán)境中,需要能時刻監(jiān)測各類信號并且運(yùn)行相應(yīng)的人工智能算法來判斷運(yùn)行狀況。在這些場景下,傳感器必須依靠電池供電,而超低功耗人工智能可以大大減少電池消耗,這也意味著傳感器更換電池的間隔可以提升,這也就大大降低了這類傳感器系統(tǒng)的部署和維護(hù)成本。
超低功耗人工智能芯片的技術(shù)路徑
目前,超低功耗人工智能芯片大概可以分為三種技術(shù)路徑。
首先是基于數(shù)字電路的超低功耗人工智能加速模塊設(shè)計(jì)。使用數(shù)字電路向超低功耗方向的優(yōu)化方法首先是從系統(tǒng)架構(gòu)層面做優(yōu)化,盡量減小模型的體積,并優(yōu)化數(shù)據(jù)流以降低內(nèi)存訪問開銷。此外,在電路層面可以降低電源電壓,甚至使用亞閾值邏輯門設(shè)計(jì),以降低電路運(yùn)行時的功耗,以及漏電流。使用數(shù)字電路方法的優(yōu)勢在于可以更容易地與人工智能計(jì)算之外的模塊集成并構(gòu)成SoC,而無需在數(shù)模轉(zhuǎn)換上消耗額外能量。
第二條技術(shù)路徑是使用模擬計(jì)算來完成神經(jīng)網(wǎng)絡(luò)的計(jì)算。模擬計(jì)算往往和內(nèi)存內(nèi)計(jì)算相結(jié)合以實(shí)現(xiàn)高能效比,其具體的思路是目前人工智能計(jì)算中往往存儲訪問是能量消耗最大的部分,而使用模擬計(jì)算則可以在存儲(如SRAM或Flash等NVM)讀出電路中直接做計(jì)算,這樣就省去了數(shù)據(jù)讀出再計(jì)算的步驟,而可以直接在內(nèi)存內(nèi)完成計(jì)算。使用模擬計(jì)算配合內(nèi)存內(nèi)計(jì)算往往可以實(shí)現(xiàn)很高的能效比,例如歐洲的著名半導(dǎo)體研究機(jī)構(gòu)IMEC宣布將在未來數(shù)年內(nèi)完成能效比高達(dá)10000TOPS/W的模擬計(jì)算人工智能加速模塊。但是模擬計(jì)算對于模型往往有較多限制,例如必須在計(jì)算精度較低時仍然能保證準(zhǔn)確率等,因此需要很好的軟件/硬件協(xié)同設(shè)計(jì)。
存內(nèi)模擬計(jì)算是超低功耗人工智能的主要技術(shù)路徑之一
第三條道路則是在模型設(shè)計(jì)上使用脈沖神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)(神經(jīng)模態(tài)芯片)。使用脈沖神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的神經(jīng)模態(tài)芯片僅僅在神經(jīng)元被激活時消耗能量,而絕大部分神經(jīng)元在大部分情況下都處于休眠狀態(tài)而幾乎不消耗能量,因此其平均能效比可以做到比基于主流卷積神經(jīng)網(wǎng)絡(luò)的芯片高一個數(shù)量級。脈沖神經(jīng)網(wǎng)絡(luò)和神經(jīng)模態(tài)芯片的難點(diǎn)主要在于模型設(shè)計(jì)和訓(xùn)練上存在很高的門檻,此外如何對相應(yīng)的脈沖神經(jīng)網(wǎng)絡(luò)模型做電路級優(yōu)化也有很高的技術(shù)含量。
超低功耗人工智能芯片競爭格局:中國公司占據(jù)有利地位
超低功耗人工智能芯片市場目前仍然處于起步階段,但是隨著未來物聯(lián)網(wǎng)和下一代智能設(shè)備的技術(shù)演進(jìn),預(yù)計(jì)在未來幾年內(nèi)市場熱度會越來越高。目前,從事超低功耗人工智能芯片開發(fā)的主要初創(chuàng)公司,但是未來超低功耗人工智能芯片的下一代領(lǐng)導(dǎo)者很可能就出現(xiàn)在這些初創(chuàng)公司中。
在消費(fèi)電子領(lǐng)域,美國的Syntiant得到了亞馬遜Alexa Fund、微軟M12和Intel Capital等行業(yè)資本的支持,其主要產(chǎn)品是針對智能設(shè)備語音處理的超低功耗芯片。與此相對,中國的初創(chuàng)公司在這個領(lǐng)域的布局則更加多樣。來自清華大學(xué)的清微科技使用可重構(gòu)電路技術(shù),其超低功耗產(chǎn)品能覆蓋語音識別、視覺識別等多個領(lǐng)域,可望為下一代智能設(shè)備賦能。另一家中國公司則是SynSense,SynSense的技術(shù)路線是使用脈沖神經(jīng)網(wǎng)絡(luò),技術(shù)來自于神經(jīng)脈沖網(wǎng)絡(luò)權(quán)威,蘇黎世大學(xué)Giacomo Indiveri教授的團(tuán)隊(duì)。目前SynSense的脈沖神經(jīng)網(wǎng)絡(luò)已經(jīng)完成了多次流片迭代和驗(yàn)證,相關(guān)的產(chǎn)品覆蓋了視覺、生物信號處理、語音識別等,平均功耗可以低至微瓦數(shù)量級。此外,SynSense還于最近推出了使用神經(jīng)脈沖網(wǎng)絡(luò)結(jié)合動態(tài)視覺傳感器DVS的產(chǎn)品Speck,該產(chǎn)品能真正實(shí)現(xiàn)事件驅(qū)動,在絕大多數(shù)時間運(yùn)行于超低的功耗下,而在檢測到動態(tài)事件后DVS能提供超高的視覺采樣頻率,并且配合脈沖神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)超高性能/超低延遲的視覺信號處理,從而兼具超低功耗和高性能。
而在工業(yè)應(yīng)用領(lǐng)域,同樣來自清華大學(xué)的湃方科技走在了全球前列,成為了在工業(yè)領(lǐng)域能真正落地的超低功耗人工智能算法和芯片解決方案公司。湃方科技的應(yīng)用場景涵蓋了衛(wèi)星、機(jī)械臂、發(fā)電機(jī)、電機(jī)等等重要的工業(yè)應(yīng)用,其芯片能提供高達(dá)50TOPS/W的能效比。
目前,在超低功耗人工智能芯片領(lǐng)域,中國的初創(chuàng)公司和團(tuán)隊(duì)無論是數(shù)量還是質(zhì)量都走在了全球前列。讓我們期待中國能在未來的超低功耗人工智能領(lǐng)域繼續(xù)引領(lǐng)全球的潮流。