《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 清微智能可重構(gòu)架構(gòu)的進擊之路

清微智能可重構(gòu)架構(gòu)的進擊之路

2021-02-02
來源:半導體行業(yè)觀察

  在與清微智能CEO王博交流的過程中,他一再向筆者強調(diào):“清微智能芯片的最大特點就在于其基于粗粒度可重構(gòu)架構(gòu)設(shè)計的芯片,這對于AI算法在當前和未來還將持續(xù)演進的現(xiàn)狀,是非常之有意義的?!?br/>

  王博進一步指出,所謂的粗粒度可重構(gòu)計算(Coarse-grained Reconfigurable Architecture CGRA),是一種全新的芯片架構(gòu)技術(shù),可根據(jù)算法和應(yīng)用的不同靈活配置硬件資源,執(zhí)行不同的任務(wù),同時具備通用芯片的靈活性和專用集成電路的高效性。據(jù)2015年國際半導體技術(shù)發(fā)展路線圖(ITRS)的預(yù)測,CGRA是未來最有發(fā)展前途的新興計算架構(gòu)之一。而成立于2018的清微智能也在短短幾年間發(fā)展成為這個領(lǐng)域扛大旗的企業(yè)之一的。

  之所以能達成這樣的成就,按照王博介紹,這主要得益于公司的初創(chuàng)團隊過去多年在這個領(lǐng)域的研究。

  源自清華大學,不同于FPGA的可重構(gòu)

  其實可重構(gòu)計算并不是什么新鮮事物。

  據(jù)維基百科,早在上世紀六十年代,就有專家提出。但受限于當時的技術(shù)水平,可重構(gòu)在當時并不能實現(xiàn),但這種思路一直被行業(yè)所銘記,而上世紀八十年代面世的FPGA可算得上是“可重構(gòu)”概念的產(chǎn)物。

  踏入最近十幾年,科學技術(shù)快速發(fā)展,新興應(yīng)用層出不窮,算法也日新月異。與此同時,高性能芯片的研發(fā)成本與日俱增,這就讓產(chǎn)學研都加倍重視相對靈活的可重構(gòu)架構(gòu),尤其是進入21世紀第二個十年,人工智能的快速興起,吸引了全球?qū)芍貥?gòu)的高度關(guān)注。例如美國DARPA在2018年啟動的“電子復興計劃”(ERI)中就提到要研發(fā)具有軟件和硬件雙編程能力。

  作為對比,國內(nèi)頂級學府清華大學也早在2006年就成立了可重構(gòu)計算實驗室,在魏少軍教授和尹首一教授的帶領(lǐng)下開啟了中國可重構(gòu)芯片的研發(fā)歷程,并在此過程中取得了耀眼的成績,這比美國足足早了十幾年。

  相關(guān)資料也顯示,該團隊先后在2016年和2017年分別推出了Thinker-I、Thinker-Ⅱ及Thinker-S等基于CGRA結(jié)構(gòu)的加速器芯片。據(jù)筆者了解,清華大學團隊所使用的CGRA架構(gòu)是一種無指令驅(qū)動的可重構(gòu)計算架構(gòu),由數(shù)據(jù)流驅(qū)動,面向異構(gòu)的空域計算,將軟件通過不同的管道輸送到硬件中來執(zhí)行功能,能實時地根據(jù)算法和產(chǎn)品的需求改變硬件資源,從而以更高的資源利用率和數(shù)據(jù)復用率去計算特殊需求,在合理分配和使用算力的同時,成倍節(jié)約數(shù)據(jù)存儲和傳輸帶寬。

  微信圖片_20210202100251.png

  微信公眾號mikesiroom的作者在其文章中也指出,傳統(tǒng)AI加速器通常面向如卷積和矩陣乘累加等深度學習算法的核心部分,但在諸如pooling,normalization,softmax等運算上,要么依賴CPU端進行運算,要么借助專門的硬件模塊。但在這兩種方案中,前者性能不高,后者面積較大。但清華大學團隊的Thinker的解決方案是通過對PE陣列的動態(tài)配置,以相同的硬件支持全部深度學習的的功能。這樣就能讓基于CGRA的芯片獲得更好的PPA,給端側(cè)設(shè)備帶來重要的價值。

  “在經(jīng)歷了十幾年的研究之后,他們決定把這個技術(shù)轉(zhuǎn)化,并在2018年成立了清微智能”。清華大學可重構(gòu)計算實驗室的負責人之一、清微智能的首席科學家尹首一教授在一次采訪中告訴半導體行業(yè)觀察記者。他進一步指出,這種全新的芯片架構(gòu)技術(shù),可以根據(jù)不同的算法和應(yīng)用需求靈活重構(gòu)硬件資源,同時具備了通用計算芯片的靈活性和專用集成電路高效性的特點。

  雖然與上述的FPGA都屬于可重構(gòu)技術(shù),但從王博的介紹我們得知,CGRA與FPGA有三點主要的區(qū)別:

  第一、FPGA的運算過程其是通過查找表來完成的,需要大量的結(jié)果預(yù)存,對存儲器的要求要特別大,同時,在計算的過程中需要頻繁的訪存,會產(chǎn)生大量的功耗;CGRA是基于數(shù)據(jù)流運算,不需要大量的存儲器開銷,在寄存器直接傳導數(shù)據(jù),能量效率高;

  第二、FPGA基于查找表的執(zhí)行方式實現(xiàn)細粒度的運算,使得運算過程中內(nèi)部電路關(guān)鍵路徑長,主頻沒法做高,同時,會耗費大量功耗;而CGRA是一種空域計算,數(shù)據(jù)計算過程中可以并行進行,關(guān)鍵路徑短,計算頻率可以很高。

  第三,F(xiàn)PGA是一種靜態(tài)重構(gòu),應(yīng)用發(fā)生改變時,重構(gòu)的過程是需要重新燒制,是一種離線的過程,需要較長時間,而CGRA是一種動態(tài)的重構(gòu)過程,算法和應(yīng)用發(fā)生改變時,在運算過程直接重構(gòu),時間開銷是微秒級,這過程甚至不會被察覺到。

  “CPU采用指令集方式,實現(xiàn)了通用計算,但是他們的計算過程,讓他們能效有損失,在與他們相比時,我們的架構(gòu)擁有1000倍的能耗比優(yōu)勢;FPGA采用了查找表的方式工作,帶來資源的浪費,與他們相比,我們的能耗比也高了100倍;GPU采用單指令多數(shù)據(jù)的運行架構(gòu),但受限于指令集讀取的模式,我們相比他也有10倍左右的優(yōu)勢”,尹首一教授曾經(jīng)用形象的數(shù)字將可重構(gòu)計算與其它幾種技術(shù)路線的性能做過對比。

  從語音到圖像,AI芯片初體驗

  在多年技術(shù)積累的助推下,清微智能在成立僅一年之后,就推出了全球首款可重構(gòu)超低功耗語音人工智能芯片TX210。據(jù)介紹,這是一顆采用臺積電40nm ULP工藝制造的的芯片,能夠支持離線語音喚醒、5個喚醒詞、10個命令詞以及聲紋識別。此外,這顆芯片還能夠支持3到5米的原廠語音喚醒和識別。然而其芯片的工作頻率僅為50Mhz,延遲更是不到10ms。

  因為是一顆面向端側(cè),甚至電池供電產(chǎn)品的芯片,TX210在功耗方面也有不錯的表現(xiàn),這主要得益于公司在設(shè)計該芯片時候引入的多級功耗喚醒模式。據(jù)介紹,這顆芯片只有在通過麥克風檢測到人聲時才會被激活,也僅有在準確監(jiān)聽到“喚醒詞”后,才會去喚醒處于休眠狀態(tài)的主控處理器芯片。這就幫助把芯片的工作功耗控制在2mw內(nèi),而語音語音活動檢測(Voice Activity Detection,VAD)功耗也降至100uW內(nèi)。

  作為一款CGRA架構(gòu)的芯片,TX210擁有極高的靈活性,不但能夠支持多比特DNN神經(jīng)網(wǎng)絡(luò),還可以支持1到16bit位寬的神經(jīng)網(wǎng)絡(luò)運算以及FFT/MEL FILTER等。

  王博則表示,TX210的推出,符合他們作為一個初創(chuàng)公司的定位。在他看來,初創(chuàng)企業(yè)的發(fā)展,要遵循從小投入到大投入的原則,這也是清微智能選擇首先從做投入較少的語音芯片TX210開始的原因。“因為語音芯片要求沒那么高,外圍單元需求也相對少,頻率低,工藝節(jié)點也低”,王博補充說。

  他進一步指出,TX210無論是在算力,還是能效方面,都有比較大的優(yōu)勢,這讓他們有足夠的底氣與客戶一起,將這顆芯片推向了智能耳機、智能手表、智能家居和平板等行業(yè)。據(jù)透露,TX210目前的出貨量已經(jīng)達到了百萬級別。

  在語音芯片上旗開得勝之后,清微智能順勢帶來了全球首款可重構(gòu)多模態(tài)智能計算芯片TX510。

微信圖片_20210202100322.jpg

  從相關(guān)資料可以看到,TX510 是一款面向 IoT 設(shè)備的超低功耗視覺處理芯片,以可重構(gòu)架構(gòu)設(shè)計,能實現(xiàn)高性能計算,低功率消耗的超強能效比,峰值算力達 2TOPS。正是基于這樣的設(shè)計,客戶如果想開發(fā)系列產(chǎn)品,或者在市場競爭中用差異化的的產(chǎn)品來獲得優(yōu)勢,就可以TX510上做便捷開發(fā),而不用做太多改變。

  來到算法模型支持方面,TX510支持 AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、Yolo、SSD、FCN 和 SegNet 等主流神經(jīng)網(wǎng)絡(luò);同時還內(nèi)置 3D 引擎,可實現(xiàn)人臉識別、物體識別、手勢識別、目標跟蹤等功能,可應(yīng)用于智能安防監(jiān)控、智能家居、新零售等領(lǐng)域。

  在筆者與王博的交流中,他多次談到了TX510的可重構(gòu)優(yōu)勢,同時因為公司在編譯工具鏈上的投入,那就意味著開發(fā)者不用理解CGRA硬件層面的工作原理,可以保持原有的開發(fā)習慣就好,讓開發(fā)者可以很快上手。他同時還指出,這個芯片因為集成了多種存儲、外設(shè)接口豐富,同時還提供豐富的開發(fā)資源,這就使得基于其開發(fā)產(chǎn)品擁有開發(fā)周期短和投入人力少的優(yōu)勢。

  “基于TX510運算特性,自動輸出包含剪枝參數(shù),低比特參數(shù)在內(nèi)的最優(yōu)模型優(yōu)化策略,使開發(fā)者的算法模型最高效率的運行在TX510芯片上,并保持出色的低功耗性能。也提供包含人臉識別,ADAS,視頻監(jiān)控,智能家居等多種應(yīng)用場景的完整解決方案,客戶可快速完成相應(yīng)場景的產(chǎn)品開發(fā)?!蓖醪娬{(diào)。

  從當前的競爭格局來看,TX510基本上算是市面上能效比最高的視覺芯片(也可以稱為有效算力高),這主要是因為可重構(gòu)計算架構(gòu)能根據(jù)算法和應(yīng)用改變硬件資源,所以可以集中硬件資源去計算特殊需求(MCU和其它的圖像AI芯片在計算時有很多不必要的數(shù)據(jù)搬運,消耗大量資源)。上述靈活性與低功耗正是TX510獲得客戶認可的兩個關(guān)鍵點。

  “TX510從2020年10月份正式量產(chǎn),迄今為止累計出貨量50萬顆”,王博告訴記者。

  替代通用,可重構(gòu)的未來目標

  毫無疑問,可重構(gòu)架構(gòu)是一個很有前景的技術(shù)。清微智微在語音和圖像AI芯片上的梅開二度也一再證明了可重構(gòu)的潛力。但王博表示,無論是對于可重構(gòu),還是清微智能,現(xiàn)在離他們想要實現(xiàn)的目標還有一段距離。他首先以可重構(gòu)架構(gòu)在AI芯片市場應(yīng)用為例,說明了可重構(gòu)面臨的一些挑戰(zhàn)。

  “雖然我們在可重構(gòu)芯片上的軟件、工具鏈上做了很大的努力,但作為一個初創(chuàng)企業(yè),我們目前能做的也只是滿足大部分用戶的需求,不得不承認,離真正發(fā)展成熟,還需要一段距離”,王博說道。他同時也指出:可重構(gòu)架構(gòu)的特性,讓其可以在多個領(lǐng)域發(fā)揮作用,其具有的天然的可擴展性,可通過算力擴展,將高能效,靈活性的特點更好的發(fā)揮出來,因此,也非常適合做數(shù)據(jù)量更大的訓練芯片。公司也在做積極布局云端市場,團隊早在數(shù)年前就開始做技術(shù)預(yù)研和芯片驗證,同樣功耗下更高算力等多個實驗指標保證公司可快速進入服務(wù)器和云計算市場。

  “我們認為,可重構(gòu)架構(gòu)正在就朝著更通用的方向前進,可以運行更多的算法,代替DSP和CPU等傳統(tǒng)架構(gòu)去做更多的事。這里說的代替是高層次的代替,用更高的性能和更高的能效朝著這兩個方向前進”,王博表示。

  在與王博的交談中,他多次強調(diào),清微智能從來沒有把自己定義為一家AI芯片公司,而是恰好AI市場的發(fā)展,讓公司的可重構(gòu)架構(gòu)找到了一個落地的場景。這正與他所說的“清微智能的發(fā)展方向以可重構(gòu)架構(gòu)為核心,在某些具體賽道上為客戶提供芯片及解決方案,”的觀點相契合,目前來看,這些賽道是指那些對語音或圖像等有持續(xù)大計算量需求的領(lǐng)域。

  回看芯片產(chǎn)業(yè)的發(fā)展,在摩爾定律的指導下,芯片的處理能力與以前相比有了指數(shù)級別的增長。但到了現(xiàn)在,受限于材料與制造水平,芯片不能再像以往那樣通過簡單的微縮來實現(xiàn)性能的提升。然而,人工智能等新興應(yīng)用對芯片性能的增加依然有很高的需求。為此探索新的解決方案,成為了行業(yè)追逐的重點。

  可重構(gòu),正是這個問題的一個答案。

  


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。