成人欧美一区二区三区视频,中文字幕人妻有码在线电影,国产精品亚洲成人久久免费看

清微智能可重構(gòu)架構(gòu)的進擊之路

日期： 2021-02-02

來源：半導體行業(yè)觀察

關(guān)鍵詞： 清微智能可重構(gòu)架構(gòu)

　　在與清微智能CEO王博交流的過程中，他一再向筆者強調(diào)：“清微智能芯片的最大特點就在于其基于粗粒度可重構(gòu)架構(gòu)設(shè)計的芯片，這對于AI算法在當前和未來還將持續(xù)演進的現(xiàn)狀，是非常之有意義的?！?br/>

　　王博進一步指出，所謂的粗粒度可重構(gòu)計算（Coarse-grained Reconfigurable Architecture CGRA），是一種全新的芯片架構(gòu)技術(shù)，可根據(jù)算法和應(yīng)用的不同靈活配置硬件資源，執(zhí)行不同的任務(wù)，同時具備通用芯片的靈活性和專用集成電路的高效性。據(jù)2015年國際半導體技術(shù)發(fā)展路線圖（ITRS）的預(yù)測，CGRA是未來最有發(fā)展前途的新興計算架構(gòu)之一。而成立于2018的清微智能也在短短幾年間發(fā)展成為這個領(lǐng)域扛大旗的企業(yè)之一的。

　　之所以能達成這樣的成就，按照王博介紹，這主要得益于公司的初創(chuàng)團隊過去多年在這個領(lǐng)域的研究。

　　源自清華大學，不同于FPGA的可重構(gòu)

　　其實可重構(gòu)計算并不是什么新鮮事物。

　　據(jù)維基百科，早在上世紀六十年代，就有專家提出。但受限于當時的技術(shù)水平，可重構(gòu)在當時并不能實現(xiàn)，但這種思路一直被行業(yè)所銘記，而上世紀八十年代面世的FPGA可算得上是“可重構(gòu)”概念的產(chǎn)物。

　　踏入最近十幾年，科學技術(shù)快速發(fā)展，新興應(yīng)用層出不窮，算法也日新月異。與此同時，高性能芯片的研發(fā)成本與日俱增，這就讓產(chǎn)學研都加倍重視相對靈活的可重構(gòu)架構(gòu)，尤其是進入21世紀第二個十年，人工智能的快速興起，吸引了全球?qū)芍貥?gòu)的高度關(guān)注。例如美國DARPA在2018年啟動的“電子復興計劃”（ERI）中就提到要研發(fā)具有軟件和硬件雙編程能力。

　　作為對比，國內(nèi)頂級學府清華大學也早在2006年就成立了可重構(gòu)計算實驗室，在魏少軍教授和尹首一教授的帶領(lǐng)下開啟了中國可重構(gòu)芯片的研發(fā)歷程，并在此過程中取得了耀眼的成績，這比美國足足早了十幾年。

　　相關(guān)資料也顯示，該團隊先后在2016年和2017年分別推出了Thinker-I、Thinker-Ⅱ及Thinker-S等基于CGRA結(jié)構(gòu)的加速器芯片。據(jù)筆者了解，清華大學團隊所使用的CGRA架構(gòu)是一種無指令驅(qū)動的可重構(gòu)計算架構(gòu)，由數(shù)據(jù)流驅(qū)動，面向異構(gòu)的空域計算，將軟件通過不同的管道輸送到硬件中來執(zhí)行功能，能實時地根據(jù)算法和產(chǎn)品的需求改變硬件資源，從而以更高的資源利用率和數(shù)據(jù)復用率去計算特殊需求，在合理分配和使用算力的同時，成倍節(jié)約數(shù)據(jù)存儲和傳輸帶寬。

　　微信圖片_20210202100251.png

　　微信公眾號mikesiroom的作者在其文章中也指出，傳統(tǒng)AI加速器通常面向如卷積和矩陣乘累加等深度學習算法的核心部分，但在諸如pooling，normalization，softmax等運算上，要么依賴CPU端進行運算，要么借助專門的硬件模塊。但在這兩種方案中，前者性能不高，后者面積較大。但清華大學團隊的Thinker的解決方案是通過對PE陣列的動態(tài)配置，以相同的硬件支持全部深度學習的的功能。這樣就能讓基于CGRA的芯片獲得更好的PPA，給端側(cè)設(shè)備帶來重要的價值。

　　“在經(jīng)歷了十幾年的研究之后，他們決定把這個技術(shù)轉(zhuǎn)化，并在2018年成立了清微智能”。清華大學可重構(gòu)計算實驗室的負責人之一、清微智能的首席科學家尹首一教授在一次采訪中告訴半導體行業(yè)觀察記者。他進一步指出，這種全新的芯片架構(gòu)技術(shù)，可以根據(jù)不同的算法和應(yīng)用需求靈活重構(gòu)硬件資源，同時具備了通用計算芯片的靈活性和專用集成電路高效性的特點。

　　雖然與上述的FPGA都屬于可重構(gòu)技術(shù)，但從王博的介紹我們得知，CGRA與FPGA有三點主要的區(qū)別：

　　第一、FPGA的運算過程其是通過查找表來完成的，需要大量的結(jié)果預(yù)存，對存儲器的要求要特別大，同時，在計算的過程中需要頻繁的訪存，會產(chǎn)生大量的功耗；CGRA是基于數(shù)據(jù)流運算，不需要大量的存儲器開銷，在寄存器直接傳導數(shù)據(jù)，能量效率高；

　　第二、FPGA基于查找表的執(zhí)行方式實現(xiàn)細粒度的運算，使得運算過程中內(nèi)部電路關(guān)鍵路徑長，主頻沒法做高，同時，會耗費大量功耗；而CGRA是一種空域計算，數(shù)據(jù)計算過程中可以并行進行，關(guān)鍵路徑短，計算頻率可以很高。

　　第三，F(xiàn)PGA是一種靜態(tài)重構(gòu)，應(yīng)用發(fā)生改變時，重構(gòu)的過程是需要重新燒制，是一種離線的過程，需要較長時間，而CGRA是一種動態(tài)的重構(gòu)過程，算法和應(yīng)用發(fā)生改變時，在運算過程直接重構(gòu)，時間開銷是微秒級，這過程甚至不會被察覺到。

　　“CPU采用指令集方式，實現(xiàn)了通用計算，但是他們的計算過程，讓他們能效有損失，在與他們相比時，我們的架構(gòu)擁有1000倍的能耗比優(yōu)勢；FPGA采用了查找表的方式工作，帶來資源的浪費，與他們相比，我們的能耗比也高了100倍；GPU采用單指令多數(shù)據(jù)的運行架構(gòu)，但受限于指令集讀取的模式，我們相比他也有10倍左右的優(yōu)勢”，尹首一教授曾經(jīng)用形象的數(shù)字將可重構(gòu)計算與其它幾種技術(shù)路線的性能做過對比。

　　從語音到圖像，AI芯片初體驗

　　在多年技術(shù)積累的助推下，清微智能在成立僅一年之后，就推出了全球首款可重構(gòu)超低功耗語音人工智能芯片TX210。據(jù)介紹，這是一顆采用臺積電40nm ULP工藝制造的的芯片，能夠支持離線語音喚醒、5個喚醒詞、10個命令詞以及聲紋識別。此外，這顆芯片還能夠支持3到5米的原廠語音喚醒和識別。然而其芯片的工作頻率僅為50Mhz，延遲更是不到10ms。

　　因為是一顆面向端側(cè)，甚至電池供電產(chǎn)品的芯片，TX210在功耗方面也有不錯的表現(xiàn)，這主要得益于公司在設(shè)計該芯片時候引入的多級功耗喚醒模式。據(jù)介紹，這顆芯片只有在通過麥克風檢測到人聲時才會被激活，也僅有在準確監(jiān)聽到“喚醒詞”后，才會去喚醒處于休眠狀態(tài)的主控處理器芯片。這就幫助把芯片的工作功耗控制在2mw內(nèi)，而語音語音活動檢測（Voice Activity Detection，VAD）功耗也降至100uW內(nèi)。

　　作為一款CGRA架構(gòu)的芯片，TX210擁有極高的靈活性，不但能夠支持多比特DNN神經(jīng)網(wǎng)絡(luò)，還可以支持1到16bit位寬的神經(jīng)網(wǎng)絡(luò)運算以及FFT/MEL FILTER等。

　　王博則表示，TX210的推出，符合他們作為一個初創(chuàng)公司的定位。在他看來，初創(chuàng)企業(yè)的發(fā)展，要遵循從小投入到大投入的原則，這也是清微智能選擇首先從做投入較少的語音芯片TX210開始的原因。“因為語音芯片要求沒那么高，外圍單元需求也相對少，頻率低，工藝節(jié)點也低”，王博補充說。

　　他進一步指出，TX210無論是在算力，還是能效方面，都有比較大的優(yōu)勢，這讓他們有足夠的底氣與客戶一起，將這顆芯片推向了智能耳機、智能手表、智能家居和平板等行業(yè)。據(jù)透露，TX210目前的出貨量已經(jīng)達到了百萬級別。

　　在語音芯片上旗開得勝之后，清微智能順勢帶來了全球首款可重構(gòu)多模態(tài)智能計算芯片TX510。

微信圖片_20210202100322.jpg

　　從相關(guān)資料可以看到，TX510 是一款面向 IoT 設(shè)備的超低功耗視覺處理芯片，以可重構(gòu)架構(gòu)設(shè)計，能實現(xiàn)高性能計算，低功率消耗的超強能效比，峰值算力達 2TOPS。正是基于這樣的設(shè)計，客戶如果想開發(fā)系列產(chǎn)品，或者在市場競爭中用差異化的的產(chǎn)品來獲得優(yōu)勢，就可以TX510上做便捷開發(fā)，而不用做太多改變。

　　來到算法模型支持方面，TX510支持 AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、Yolo、SSD、FCN 和 SegNet 等主流神經(jīng)網(wǎng)絡(luò)；同時還內(nèi)置 3D 引擎，可實現(xiàn)人臉識別、物體識別、手勢識別、目標跟蹤等功能，可應(yīng)用于智能安防監(jiān)控、智能家居、新零售等領(lǐng)域。

　　在筆者與王博的交流中，他多次談到了TX510的可重構(gòu)優(yōu)勢，同時因為公司在編譯工具鏈上的投入，那就意味著開發(fā)者不用理解CGRA硬件層面的工作原理，可以保持原有的開發(fā)習慣就好，讓開發(fā)者可以很快上手。他同時還指出，這個芯片因為集成了多種存儲、外設(shè)接口豐富，同時還提供豐富的開發(fā)資源，這就使得基于其開發(fā)產(chǎn)品擁有開發(fā)周期短和投入人力少的優(yōu)勢。

　　“基于TX510運算特性，自動輸出包含剪枝參數(shù)，低比特參數(shù)在內(nèi)的最優(yōu)模型優(yōu)化策略，使開發(fā)者的算法模型最高效率的運行在TX510芯片上，并保持出色的低功耗性能。也提供包含人臉識別，ADAS，視頻監(jiān)控，智能家居等多種應(yīng)用場景的完整解決方案，客戶可快速完成相應(yīng)場景的產(chǎn)品開發(fā)?！蓖醪娬{(diào)。

　　從當前的競爭格局來看，TX510基本上算是市面上能效比最高的視覺芯片（也可以稱為有效算力高），這主要是因為可重構(gòu)計算架構(gòu)能根據(jù)算法和應(yīng)用改變硬件資源，所以可以集中硬件資源去計算特殊需求（MCU和其它的圖像AI芯片在計算時有很多不必要的數(shù)據(jù)搬運，消耗大量資源）。上述靈活性與低功耗正是TX510獲得客戶認可的兩個關(guān)鍵點。

　　“TX510從2020年10月份正式量產(chǎn)，迄今為止累計出貨量50萬顆”，王博告訴記者。

　　替代通用，可重構(gòu)的未來目標

　　毫無疑問，可重構(gòu)架構(gòu)是一個很有前景的技術(shù)。清微智微在語音和圖像AI芯片上的梅開二度也一再證明了可重構(gòu)的潛力。但王博表示，無論是對于可重構(gòu)，還是清微智能，現(xiàn)在離他們想要實現(xiàn)的目標還有一段距離。他首先以可重構(gòu)架構(gòu)在AI芯片市場應(yīng)用為例，說明了可重構(gòu)面臨的一些挑戰(zhàn)。

　　“雖然我們在可重構(gòu)芯片上的軟件、工具鏈上做了很大的努力，但作為一個初創(chuàng)企業(yè)，我們目前能做的也只是滿足大部分用戶的需求，不得不承認，離真正發(fā)展成熟，還需要一段距離”，王博說道。他同時也指出：可重構(gòu)架構(gòu)的特性，讓其可以在多個領(lǐng)域發(fā)揮作用，其具有的天然的可擴展性，可通過算力擴展，將高能效，靈活性的特點更好的發(fā)揮出來，因此，也非常適合做數(shù)據(jù)量更大的訓練芯片。公司也在做積極布局云端市場，團隊早在數(shù)年前就開始做技術(shù)預(yù)研和芯片驗證，同樣功耗下更高算力等多個實驗指標保證公司可快速進入服務(wù)器和云計算市場。

　　“我們認為，可重構(gòu)架構(gòu)正在就朝著更通用的方向前進，可以運行更多的算法，代替DSP和CPU等傳統(tǒng)架構(gòu)去做更多的事。這里說的代替是高層次的代替，用更高的性能和更高的能效朝著這兩個方向前進”，王博表示。

　　在與王博的交談中，他多次強調(diào)，清微智能從來沒有把自己定義為一家AI芯片公司，而是恰好AI市場的發(fā)展，讓公司的可重構(gòu)架構(gòu)找到了一個落地的場景。這正與他所說的“清微智能的發(fā)展方向以可重構(gòu)架構(gòu)為核心，在某些具體賽道上為客戶提供芯片及解決方案，”的觀點相契合，目前來看，這些賽道是指那些對語音或圖像等有持續(xù)大計算量需求的領(lǐng)域。

　　回看芯片產(chǎn)業(yè)的發(fā)展，在摩爾定律的指導下，芯片的處理能力與以前相比有了指數(shù)級別的增長。但到了現(xiàn)在，受限于材料與制造水平，芯片不能再像以往那樣通過簡單的微縮來實現(xiàn)性能的提升。然而，人工智能等新興應(yīng)用對芯片性能的增加依然有很高的需求。為此探索新的解決方案，成為了行業(yè)追逐的重點。

　　可重構(gòu)，正是這個問題的一個答案。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

清微智能可重構(gòu)架構(gòu)的進擊之路

日期： 2021-02-02

來源：半導體行業(yè)觀察

相關(guān)內(nèi)容