2017年的國際固態(tài)半導(dǎo)體電路大會落下帷幕已經(jīng)半個多月,半導(dǎo)體業(yè)的同仁們又回到了工作狀態(tài)。我們不妨回過頭來好好檢視今年ISSCC上的議程和論文,看看2017年半導(dǎo)體電路行業(yè)哪些方向正在變得熱門。
用于人工智能的深度學(xué)習(xí)芯片
今年ISSCC的主題是“Intelligent Chips for A Smart World”,“人工智能”這個關(guān)鍵詞幾乎呼之欲出。2012年后,人工智能以Alexnet誕生為標(biāo)志迎來了高速發(fā)展期。隨著去年AlphaGO戰(zhàn)勝李世石,人們對這輪人工智能大潮的期待又上了一個臺階。
這一代人工智能的主要技術(shù)是深度神經(jīng)網(wǎng)絡(luò)(DNN)。具體地,目前深度學(xué)習(xí)應(yīng)用最火的領(lǐng)域是在計算機(jī)視覺領(lǐng)域,而該領(lǐng)域由于應(yīng)用的特性(圖片中特征的本地性),最適合的網(wǎng)絡(luò)結(jié)構(gòu)是深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)。最初,人工智能應(yīng)用都是運(yùn)行在CPU上,目標(biāo)是評估深度學(xué)習(xí)模型的性能(預(yù)測/分類準(zhǔn)確度等),運(yùn)行速度并不是最關(guān)鍵的指標(biāo)。然而,隨著深度學(xué)習(xí)逐漸實用化,具體的硬件部署和運(yùn)行效率變得越來越重要,畢竟如果一次人臉識別需要1分鐘才能完成那么用戶體驗太差了。這時候,大家發(fā)現(xiàn)CPU已經(jīng)不夠用了,原因是CPU中太多的芯片面積用在了復(fù)雜的控制邏輯上,用于計算的單元其實并不多,而DCNN需要的是大量并行運(yùn)算,其控制流并不復(fù)雜。因此CPU并不適合DCNN應(yīng)用。AlexNet的部署中用到了GPU,可以說是深度學(xué)習(xí)硬件上的第一次革命。相比CPU,GPU中的控制流較簡單,大部分芯片面積都用做運(yùn)算,因此非常適合深度學(xué)習(xí)應(yīng)用。而且,GPU使用SIMT(單指令流多線程)的架構(gòu),能夠?qū)?nèi)存訪問延遲帶來的影響降低到最小,從而實現(xiàn)高性能計算。
然而,GPU雖然能夠減小內(nèi)存訪問延遲的影響,卻不能減小內(nèi)存訪問次數(shù)。GPU每次訪問內(nèi)存都伴隨著能量消耗,因此一旦內(nèi)存訪問次數(shù)多了,能量消耗就很大,這就使得GPU無法使用在對能量消耗約束較多的場合。為了能夠普及人工智能,專用的ASIC勢在必行。也正因為ASIC需要優(yōu)化能量,所以機(jī)器學(xué)習(xí)ASIC的主要指標(biāo)是能量效率OPS/W=OP/J,即單位能量可以實現(xiàn)的操作數(shù)。
機(jī)器學(xué)習(xí)ASIC在ISSCC上其實很早就有相關(guān)論文,例如來自韓國KAIST的Yoo組在近五年來一直在發(fā)表相關(guān)論文,但是之前機(jī)器學(xué)習(xí)往往是作為視覺SoC的一個特性,而不是最大的賣點(diǎn),發(fā)表的論文也是以視覺SoC的名義。直到2016年,來自MIT的陳喻新在ISSCC發(fā)表了Eyeriss,深度學(xué)習(xí)加速器的概念一炮而紅,天下群雄響應(yīng)。Eyeriss明確提出了傳統(tǒng)GPU方案的問題在于數(shù)據(jù)流中的內(nèi)存訪問太浪費(fèi)能量并且會成為性能瓶頸,而DCNN算法中許多數(shù)據(jù)是可以復(fù)用的,因此優(yōu)化數(shù)據(jù)訪問是深度學(xué)習(xí)加速器的重要優(yōu)化方向。Eyeriss的能量效率可達(dá)200GOPS/W左右,相對于GPU是巨大的進(jìn)步。
Eyeriss架構(gòu)圖
在去年,Eyeriss發(fā)表的session名叫Next-Generation Processors,而在Eyeriss名震江湖后,無數(shù)人做了follow up,于是今年這個session干脆改名成了Deep-Learning Processors,因為大家都在做深度學(xué)習(xí)加速。今年論文的主要賣點(diǎn)仍然是數(shù)據(jù)流優(yōu)化,除此之外還有計算精度優(yōu)化。今年論文能量效率已經(jīng)從去年Eyeriss的200GOPS/W進(jìn)化到了2.9TOPS/W(STMicroelectronics),8.1TOPS/W(KAIST)甚至10TOPS/W(KU Leuven),照這么玩下去恐怕能量效率很快就會到瓶頸,接下來要做的優(yōu)化就是要做差異化了。
同頻全雙工收發(fā)機(jī)
隨著無線通訊技術(shù)的發(fā)展,各種應(yīng)用對于帶寬需求越來越高,頻譜資源也顯得越來越捉襟見肘。如何提高頻譜資源的利用率?之前的FDM(頻分復(fù)用)通訊協(xié)議往往需要給上行鏈路和下行鏈路分配不同的頻段,那么有沒有可能使用同一個頻段同時做上行鏈路和下行鏈路,即全雙工?如果使用全雙工同頻收發(fā)機(jī),那么頻譜資源利用率一下就翻倍了!
如果要做全雙工的話,主要問題就是如何解決發(fā)射機(jī)(TX)和接收機(jī)(RX)互相干擾。TX的射頻信號能量可以比RX接收到的能量高5-6個數(shù)量級,因此如果同時同頻傳輸?shù)脑扵X對RX的干擾問題不解決好RX這邊一定就沒法工作了。這個問題其實已經(jīng)有不少人研究了很久,之前也有不同切入點(diǎn)的解決方案,例如UCLA Ethan Wang組的秦逝寒就利用時變傳輸線實現(xiàn)能很好地隔離TX/RX的全雙工。另外的一條路則是利用較傳統(tǒng)的射頻系統(tǒng)(包括基于CMOS的射頻電路以及標(biāo)準(zhǔn)的射頻前端元件例如雙工器)來實現(xiàn)全雙工,這種方案往往使用電路系統(tǒng),在RX鏈路合適的位置加入一個和TX干擾信號完全相反的信號來抵消TX的干擾。這條路主要先驅(qū)者是哥倫比亞大學(xué)的Prof. Harish Krishnaswamy。2014年ISSCC,Prof. Harish Krishnaswamy組的Jin Zhou發(fā)表了他們組第一篇使用干擾抵消技術(shù)的論文,引發(fā)了半導(dǎo)體行業(yè)極大的興趣,來自學(xué)術(shù)界和工業(yè)界的同行們基于這篇論文做了許多后續(xù)工作,而Krishnaswamy組自己也繼續(xù)做了不少改進(jìn)。而也正是Krishnaswamy組這幾年在ISSCC連續(xù)發(fā)表關(guān)于全雙工TRX的高質(zhì)量論文今年的ISSCC才會有這樣的一個session,而發(fā)表第一篇論文的Jin Zhou也憑借著漂亮的工作順利拿到了UIUC的教職。
今年該Session的三篇論文,分別來自于華盛頓大學(xué)(西雅圖)的Tong Zhang,哥倫比亞大學(xué)Krishnaswamy組的Negar Reiskarimian和臺灣清華大學(xué)的Yu-Hsien Kao。兩篇是工作在傳統(tǒng)2GHz以下頻段的射頻收發(fā)機(jī),另一篇則是10GHz X-band的FMCW雷達(dá)。
毫米波/THz為主流接受
毫米波/太赫茲電路在前幾年的ISSCC都有單獨(dú)的session,但是今年卻不再有單獨(dú)的session。但是,并不是因為毫米波/THz電路不再受到青睞,而是這些電路被歸到了TX and RX Building Blocks的session中(Session 17)??梢?,原本這些電路因為工作頻率較高而不被認(rèn)為是常規(guī)電路需要單獨(dú)的session,而在經(jīng)過多年的努力并被主流半導(dǎo)體電路社區(qū)接受后,毫米波/THz電路今年進(jìn)入了一個常規(guī)的session。
來自日本的廣島大學(xué)的論文展示了載波在300GHz,數(shù)據(jù)率高達(dá)105Gb/s的CMOS發(fā)射機(jī),令人印象深刻。
GaN Driver電路
GaN是最近很火的器件,因為其卓越的性能得到了越來越多的應(yīng)用,例如在高壓電源管理,功率放大器等等。這次在ISSCC 2017,有了一個關(guān)于GaN的新session,即Session 25: GaN Drivers and Galvanic Isolators。
ISSCC今年新加的這個session說明了GaN正在獲得越來越多的認(rèn)可。有趣的是,該session中,GaN主要還是用在電源管理,尤其是設(shè)計高電壓的電源電壓轉(zhuǎn)換電路。GaN由于很高的擊穿電壓以及較小的寄生效應(yīng),在高電壓應(yīng)用時可以做到損耗較小,目前已經(jīng)有許多大廠(例如TI等)推出了相關(guān)產(chǎn)品。GaN在電源產(chǎn)品中將會得到更大程度的普及。而目前看來TI也是GaN領(lǐng)域的領(lǐng)先者,該session四篇論文中的三篇來自于TI。