文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181522
中文引用格式: 詹瑞典,楊家昌. 基于動(dòng)態(tài)頻率的芯片面積功耗優(yōu)化設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2019,45(1):35-38.
英文引用格式: Zhan Ruidian,Yang Jiachang. Area and power consumption optimization based on dynamic frequency[J]. Application of Electronic Technique,2019,45(1):35-38.
0 引言
隨著消費(fèi)類(lèi)電子產(chǎn)品、網(wǎng)絡(luò)產(chǎn)品等市場(chǎng)的快速發(fā)展,低成本、高速、低功耗和多功能的嵌入式系統(tǒng)的需求給集成電路設(shè)計(jì)行業(yè)帶來(lái)了更大的挑戰(zhàn),實(shí)現(xiàn)更多復(fù)雜功能的單芯片集成度越來(lái)越高,同時(shí)單芯片功耗、成本也隨之增長(zhǎng)。目前,芯片的面積和功耗問(wèn)題制約著芯片性能進(jìn)一步提高,面積優(yōu)化、低功耗設(shè)計(jì)在現(xiàn)代芯片設(shè)計(jì)中越發(fā)重要,頻率、功耗、面積(PPA)指標(biāo)已經(jīng)是集成電路設(shè)計(jì)的重要指標(biāo)之一[1],通常在流片之前設(shè)計(jì)人員借助EDA工具對(duì)芯片的面積和功耗做一次精確的估算,芯片的面積及功耗是評(píng)估是否滿足設(shè)計(jì)要求的重要參數(shù)之一。
集成電路設(shè)計(jì)按照設(shè)計(jì)抽象層次可分為系統(tǒng)算法級(jí)、寄存器傳輸級(jí)、邏輯電路級(jí)和晶體管級(jí)。在超深亞微米工藝下的集成電路設(shè)計(jì)中,針對(duì)面積優(yōu)化和低功耗設(shè)計(jì),從晶體管級(jí)到系統(tǒng)算法級(jí)各層次都有相關(guān)方面的研究,抽象層次越高其優(yōu)化效果越明顯。文獻(xiàn)[2]詳細(xì)講述數(shù)字集成電路在系統(tǒng)級(jí)、寄存器級(jí)、晶體管級(jí)等各個(gè)層次目前主流的低功耗設(shè)計(jì)方法。其中,系統(tǒng)算法級(jí)主要采取的是軟硬件協(xié)同設(shè)計(jì)、功耗管理等方法降低系統(tǒng)級(jí)功耗。寄存器傳輸級(jí)主要采用編碼技巧、門(mén)控時(shí)鐘等技術(shù)來(lái)減低信號(hào)跳變的次數(shù)。邏輯電路級(jí)和晶體管級(jí)主要是從邏輯表達(dá)式設(shè)計(jì)、先進(jìn)的制造工藝等方法實(shí)現(xiàn)低功耗設(shè)計(jì)。目前減少芯片面積主要采用新的工藝、邏輯電路設(shè)計(jì)等方法來(lái)達(dá)到目標(biāo),文獻(xiàn)[3]從進(jìn)位選擇器邏輯電路設(shè)計(jì)縮小芯片面積。本文基于一款成功流片的SoC芯片項(xiàng)目,從系統(tǒng)級(jí)優(yōu)化面積和低功耗設(shè)計(jì)。
1 功耗、面積問(wèn)題分析
芯片的功耗主要有靜態(tài)功耗和動(dòng)態(tài)功耗[3],計(jì)算門(mén)級(jí)SoC功耗的估算為式(1):
靜態(tài)功耗(Cell Leakage Power)主要是由CMOS電路結(jié)構(gòu)導(dǎo)致的漏電流功耗和旁置電路功耗。漏電流功耗可以從工藝庫(kù)中查找對(duì)應(yīng)的功耗,項(xiàng)目一旦完成設(shè)計(jì),靜態(tài)功耗PLeakageTotal基本就能計(jì)算出來(lái)。相對(duì)于動(dòng)態(tài)功耗,靜態(tài)功耗對(duì)集成電路設(shè)計(jì)影響不大[5],可以忽略不計(jì),一般低功耗設(shè)計(jì)基本都是針對(duì)動(dòng)態(tài)功耗。
動(dòng)態(tài)功耗主要由短路電流(Cell Internal Power)和開(kāi)關(guān)電容(Net Switching Power)組成。PSwitching是單元門(mén)器件輸出端i負(fù)載電容充放電的功耗,TR(i)為線i的信號(hào)跳變率,即單位時(shí)間內(nèi)信號(hào)由低電平到高電平、由高電平到低電平的跳變次數(shù);CLoad(i)為門(mén)器件輸出端i的線載電容。
PInternal是由單元門(mén)器件電容充放電、P晶體管和N晶體管在關(guān)閉和打開(kāi)過(guò)程中短路形成的功耗。TR(z)表示器件輸出端的信號(hào)跳變率。從式(3)和式(4)可以看出,動(dòng)態(tài)功耗與信號(hào)的跳變、電容有直接關(guān)系,而工作頻率直接影響信號(hào)的跳變以及電容的充放電,可見(jiàn),工作頻率與PSwitching、PInternal是強(qiáng)相關(guān)關(guān)系。
芯片的面積由組合邏輯面積(Combinational Area)、緩沖器和反相器面積(Buf/Inv Area)、非組合邏輯面積(Noncombinational Area)等面積組成。在超深亞微米工藝條件下,邏輯組合電路利用半導(dǎo)體開(kāi)關(guān)元件導(dǎo)通、截止的工作特性實(shí)現(xiàn)邏輯運(yùn)算。利用門(mén)電路在不同頻率下的開(kāi)關(guān)工作原理,調(diào)節(jié)時(shí)鐘信號(hào)減少面積,如優(yōu)化邏輯通路不同的時(shí)間延遲,合理規(guī)劃不同觸發(fā)器件的不同延遲,從而實(shí)現(xiàn)面積優(yōu)化[6]。
面積的大小關(guān)系到芯片的成本,功耗的高低關(guān)系到芯片的性能。在符合功能設(shè)計(jì)要求情況下,面積越小,成本越低,功耗越低,性能越穩(wěn)定。衡量面積與功耗是一種常見(jiàn)的手段,本文針對(duì)已經(jīng)完成設(shè)計(jì)的項(xiàng)目,保持其性能不變,重點(diǎn)研究如何通過(guò)動(dòng)態(tài)頻率進(jìn)一步綜合優(yōu)化面積和降低功耗。
2 動(dòng)態(tài)頻率閉環(huán)設(shè)計(jì)
對(duì)于系統(tǒng)級(jí)芯片設(shè)計(jì)中,根據(jù)系統(tǒng)設(shè)計(jì)的具體功能要求,一般就基本確認(rèn)芯片的工藝、運(yùn)行工作頻率等參數(shù)要求范圍;其次根據(jù)項(xiàng)目設(shè)計(jì)需求設(shè)計(jì)約束條件,基于約束條件在EDA工具進(jìn)行仿真驗(yàn)證;最后通過(guò)精確的功耗和面積估算完成設(shè)計(jì),設(shè)計(jì)流程如圖1所示。其中,工程師只對(duì)設(shè)計(jì)值作出規(guī)定的響應(yīng),沒(méi)有通過(guò)多次仿真結(jié)果動(dòng)態(tài)調(diào)節(jié)工作頻率,大多都是靠工程師的經(jīng)驗(yàn)來(lái)設(shè)計(jì),通過(guò)經(jīng)驗(yàn)值給定大概工作頻率,按照?qǐng)D1的設(shè)計(jì)流程通過(guò)EDA工具再一次進(jìn)行精確的仿真并實(shí)現(xiàn)設(shè)計(jì)。圖1所示的設(shè)計(jì)流程圖可以認(rèn)為是開(kāi)環(huán)設(shè)計(jì)。該設(shè)計(jì)優(yōu)點(diǎn)是工作流程簡(jiǎn)單,但最優(yōu)頻率選擇精度不高,自動(dòng)糾偏的能力較弱,對(duì)于經(jīng)驗(yàn)不足的工程師,存在偏高功耗和面積的風(fēng)險(xiǎn)。
由式(1)可知,各節(jié)點(diǎn)的信號(hào)跳變率決定著芯片功耗,信號(hào)的跳變率由時(shí)鐘源決定,根據(jù)上述分析芯片面積與工作頻率直接相關(guān)。本文不更改原有的項(xiàng)目設(shè)計(jì),在原有開(kāi)環(huán)設(shè)計(jì)流程(圖1)中,建立反饋和訓(xùn)練通道,動(dòng)態(tài)頻率為調(diào)節(jié)參數(shù),實(shí)現(xiàn)動(dòng)態(tài)頻率閉環(huán)設(shè)計(jì)(如圖2所示)。動(dòng)態(tài)頻率閉環(huán)設(shè)計(jì)通過(guò)多組工作頻率下對(duì)應(yīng)的功耗和面積數(shù)據(jù)進(jìn)行反饋和訓(xùn)練,建立工作頻率、功耗、面積的數(shù)學(xué)模型,綜合考慮面積、功耗兩個(gè)重要指標(biāo),計(jì)算出最優(yōu)的工作頻率實(shí)現(xiàn)優(yōu)化面積和降低功耗設(shè)計(jì)。
動(dòng)態(tài)頻率閉環(huán)設(shè)計(jì)流程如圖3所示,主要步驟如下:
(1)項(xiàng)目設(shè)計(jì)要求。根據(jù)項(xiàng)目功能設(shè)計(jì)要求,編寫(xiě)時(shí)序等約束條件,并確認(rèn)目標(biāo)頻率的有效范圍。
(2)實(shí)驗(yàn)仿真。編寫(xiě)腳本,給定頻率初始值,運(yùn)用EDA工具綜合,并給出Timing、Area、Power的報(bào)告。
(3)數(shù)據(jù)記錄。記錄多組不同的工作頻率下,芯片面積、功耗等相關(guān)參數(shù)。
(4)數(shù)據(jù)篩選。保持功能不變,篩選所有滿足約束條件的芯片面積和芯片功耗具體參數(shù)。
(5)建立模型。根據(jù)記錄的數(shù)據(jù),分別建立面積與頻率、功耗與頻率數(shù)學(xué)模型。
(6)求最優(yōu)解。綜合兩組數(shù)學(xué)模型,并求出工作頻率的最優(yōu)解。
基于動(dòng)態(tài)頻率閉環(huán)設(shè)計(jì),相對(duì)于開(kāi)環(huán)設(shè)計(jì),動(dòng)態(tài)功率閉環(huán)設(shè)計(jì)精度高,選擇最優(yōu)的工作頻率實(shí)現(xiàn)面積優(yōu)化和降低功耗;其次適應(yīng)性強(qiáng),閉環(huán)設(shè)計(jì)可以適應(yīng)于不同的項(xiàng)目中,無(wú)需具備豐富經(jīng)驗(yàn)的工程師,有效地減少項(xiàng)目試錯(cuò)成本,提高項(xiàng)目設(shè)計(jì)效率。本文基于一款已經(jīng)成功流片0.11 μm工藝的SoC芯片,項(xiàng)目設(shè)計(jì)工作頻率為50 MHz,實(shí)際功能需求最低功耗為36 MHz,運(yùn)用本方法在這一款芯片上進(jìn)行進(jìn)一步的優(yōu)化面積和降低功耗設(shè)計(jì)。
3 實(shí)驗(yàn)仿真
根據(jù)動(dòng)態(tài)功耗閉環(huán)設(shè)計(jì),篩選通過(guò)約束條件的芯片面積和芯片功耗的數(shù)據(jù),通過(guò)曲線擬合分別建立面積&時(shí)鐘周期和功耗&時(shí)鐘周期的數(shù)學(xué)模型,如圖4、圖5所示。
其中,由圖4建立芯片面積與時(shí)鐘周期的數(shù)學(xué)模型如式(5)所示:
通過(guò)計(jì)算可知,時(shí)鐘周期t=22 ms,工作頻率f=1/t=45 MHz是本設(shè)計(jì)的最優(yōu)解。表1和表2分別為工作頻率45 MHz和50 MHz下仿真測(cè)試記錄的芯片面積和芯片功耗數(shù)據(jù)。
根據(jù)表1、表2可以看出,工作頻率45 MHz下的芯片總體相對(duì)比原有工作頻率50 MHz下的芯片面積縮小約0.59%,其中組合邏輯面積縮小1.17%,緩沖器和反相器面積縮小1.36%。芯片的功耗相對(duì)比面積優(yōu)化幅度更加明顯,工作頻率45 MHz下的芯片總體功耗相對(duì)比原有工作頻率50 MHz下的芯片功耗減少9.01%,其中短路電流功耗和開(kāi)關(guān)電容功耗分別減少9.09%、9.10%。
4 結(jié)論
保持原設(shè)計(jì)不變,本文基于系統(tǒng)級(jí)動(dòng)態(tài)功耗閉環(huán)設(shè)計(jì),進(jìn)一步減少面積和降低功耗,通過(guò)數(shù)據(jù)收集及仿真分析表明:本文提出的優(yōu)化方法設(shè)計(jì)可以取得較好的優(yōu)化面積和功耗,在實(shí)際工程中具有一定的參考價(jià)值。
參考文獻(xiàn)
[1] ROY K,PRASAD S.Low-power CMOS VLSI circuit design[M].Wiley,2000.
[2] 王冠軍,周勇,趙瑩,等.VLSI電路低功耗設(shè)計(jì)研究進(jìn)展[J].微電子學(xué),2011,41(2):279-284.
[3] CHOURASIA A.Area optimized adder design using carry selection logic in power-constrained environments[J].International Journal of Engineering Innovation & Research,2017,6(1):48-50.
[4] MACII E,ZAFALON R.Low-power EDA technologies:state-of-the-art and beyond[C].2006 Advanced Signal Processing,Circuit and System Design Techniques for Communications.IEEE,2006:3-43.
[5] 常曉濤,張志敏,王鑫.基于時(shí)鐘樹(shù)功耗預(yù)提取的SoC功耗估計(jì)方法[J].計(jì)算機(jī)工程,2006,32(1):234-236.
[6] NEVES J L,F(xiàn)RIEDMAN E G.Optimal clock skew scheduling tolerant to process variations[C].33rd Design Automation Conference Proceedings,1996.
作者信息:
詹瑞典1,2,楊家昌1,2
(1.佛山芯珠微電子有限公司,廣東 佛山528225;2.廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣東 廣州510006)