《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于Innovus的低功耗物理設計
基于Innovus的低功耗物理設計
2016年電子技術應用第8期
戈 喆,王志鴻,厲媛玥
恩智浦半導體,江蘇 蘇州215000
摘要: 為了減少芯片功耗,可靠的低功耗物理設計必不可少?;谛乱淮季植季€工具Innovus,分四個部分闡述了新的低功耗物理設計流程。這些內容包括:基于低功耗的物理庫設計;低功耗布局和優(yōu)化、基于輸入向量的功耗優(yōu)化;低功耗時鐘樹協同設計CCOPT(clock concurrent optimization);時鐘樹后低功耗優(yōu)化。Innovus作為Cadence全新的布局布線工具,提供基于GigaOpt引擎的功耗驅動優(yōu)化和高級時鐘樹協同優(yōu)化(CCOPT)等方法,有效幫助設計者實現低功耗芯片設計。全新的低功耗物理設計可改善芯片數字邏輯15%功耗。
中圖分類號: TN402
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.08.003
中文引用格式: 戈喆,王志鴻,厲媛玥. 基于Innovus的低功耗物理設計[J].電子技術應用,2016,42(8):21-24.
英文引用格式: Ge Zhe,Wang Zhihong,Li Yuanyue. Low power physical design in Innovus[J].Application of Electronic Technique,2016,42(8):21-24.
Low power physical design in Innovus
Ge Zhe,Wang Zhihong,Li Yuanyue
NXP Semiconductor,Suzhou 215000,China
Abstract: To reduce chip power, a reliable low power physical design is necessary. This paper introduces a improved low power physical design flow based on new PR(Place and Route) tool Innovus, from low power physical library design, to power-driven, vcd-driven placement and optimization, to low power CCOPT(Clock Concurrent Optimization) design, and to more low power optimization after CTS. Innovus is Cadence next generation PR tool, which brings a lot of low power features to help designer implement low power design, such as GigaOpt power-driven optimization and advanced CCOPT. Improved low power physical design helps reduce 15% digital power of chip.
Key words : low power;physical design;power driven;clock concurrent optimization

0 引言

  高性能與低功耗是當今芯片設計的兩個主要方向。對于便攜式設備大力發(fā)展的今天、物聯網應用呼之欲出的明天,低功耗芯片的需求空前高漲,同時也對低功耗芯片的設計提出了更高要求。為了達到更低的功耗,越來越多的低功耗技術被應用到芯片中,比如電源關斷技術(Power Shut Off,PSO)[1]、多電壓域供電(Multi Supply Power,MSV)、多電壓與時鐘模式、動態(tài)電壓頻率調節(jié)技術(Dynamic Voltage Frequency Scale,DVFS)、存儲器分割(Memory Split)、門控時鐘(Clock Gating)[2]、門控數據線[3]、多閾值電壓設計(Multi-Vt)[4]、襯底偏壓調制技術(Back Bias)等。這些方法從芯片設計的各個層面實現低功耗,芯片物理設計是其中的重要一環(huán)。本文基于新一代布局布線工具Innovus,在傳統(tǒng)低功耗物理設計流程的基礎上,研究了新的低功耗物理設計方法。

1 低功耗物理設計

  芯片物理設計是指將芯片電路和代碼轉變?yōu)樾酒鎴D的過程,布局布線是芯片物理設計的核心,本文主要討論低功耗布局布線技術。

  低功耗物理設計內容可以分為兩類,一類是對前端各種低功耗設計進行物理實現,比如在物理上對多電壓域進行劃分和布局;片上電源管理模塊和電源開關的放置和連線;通過CPF(Common Power File)控制電平轉換邏輯(Level Shifter)和隔離邏輯(Isolation Cell)的加入、電源連接、擺放和優(yōu)化;時鐘門控邏輯的擺放與優(yōu)化;掉電狀態(tài)保持寄存器(State Retention Power Gate,SRPG)電源線和單元行的布置等。另一類是在芯片物理層面(如版圖、標準單元甚至是器件級別)實現的低功耗設計,這類方法只能在芯片后端設計時實現,比如多閾值電壓標準單元庫選用,襯底偏壓調制技術,低功耗時鐘樹技術等。

  低功耗物理設計的核心是與前端設計相配合,減少芯片內一切不必要的翻轉和電容充放電,減少乃至關斷芯片內不工作模塊的漏電,減少一切時序路徑上的性能冗余,以及提供多樣化的工作模式以避免在不同應用場合的功耗浪費。精巧的低功耗物理設計能夠在保證芯片性能的基礎上,有效改善芯片功耗。

2 基于Innovus的改進低功耗物理設計

  Innovus是Cadence公司的新一代布局布線工具,不僅加強了先進工藝和高性能芯片的設計能力,也為低功耗芯片設計提供了強大的功能。本文基于Innovus,為90 nm低功耗ARM核微控制器設計了新的低功耗布局布線流程,最終功耗改善超過15%。

  2.1 低功耗標準單元庫設計

  好的芯片物理設計離不開一套與需求相匹配的標準單元庫,所以低功耗物理設計也需要一套低功耗標準單元庫。

  2.1.1 多閾值電壓單元

  這是最普遍、也是最有效的方法,通過不同閾值電壓單元的搭配,達到芯片性能與功耗的平衡[4]。

  2.1.2 加長溝道單元與選擇性加長溝道單元

  加長溝道單元(Gate Length Bias,GLB),又稱低漏電單元[5-6]。在數字標準單元電路設計中,通常晶體管的溝長都會選擇最小特征尺寸,以獲得最好的性能。但是在加長溝道單元中,所有晶體管的溝長都被加長,比如增加20%最小溝長,這是因為隨著半導體工藝越來越先進,晶體管漏電流所帶來的功耗比例越來越大,通過提高器件溝長,可以有效抑制器件短溝效應和漏致感應勢壘降低效應(DIBL),從而減小器件漏電。加長溝道單元通常應用在非關鍵時序路徑上,通過去除芯片中的冗余性能降低芯片功耗,這和多閾值電壓單元是一樣的道理。

  但是,加長溝道單元有一個問題,它會提高芯片動態(tài)功耗。因為溝道加長以后,柵面積就會增加,相應的柵電容充放電就會增加,從而增加動態(tài)功耗。為了應對這個問題,新的標準單元庫引入選擇性加長溝道單元(Selective GLB)。選擇性加長溝道單元通過有選擇地對單元內關鍵漏電晶體管進行溝道加長,在有效減少漏電的同時將單元動態(tài)功耗和性能的損失降到最低。例如,在選擇性加長溝道寄存器中,所有與時鐘相關的晶體管都不能加長溝道以避免動態(tài)功耗大量增加,而所有在寄存器掉電狀態(tài)下進行狀態(tài)保持的晶體管都建議增加溝長,以減小芯片低漏電模式下的漏電功耗。

  2.1.3 多位寄存器

  通過將多個(2、4個居多)關聯性高的寄存器合并成一個多位寄存器(Multi-bit Flip Flop),可以有效共享每個寄存器內的類同邏輯器件,減少寄存器時鐘端口相關聯電容,同時更少的寄存器數量也有助于實現更優(yōu)的時鐘樹設計[7]。

  2.1.4 多尺寸梯度單元和極小尺寸單元

  引入更多尺寸的標準單元能夠為工具提供更多選擇,有利于減少芯片在修復時序和轉換時間違例時的過量優(yōu)化。而極小尺寸單元也提供了在某些場合進一步減少功耗的可能。

  2.1.5 延時單元和保持時序改善寄存器

  延時單元(Delay Cell)可以提供大延時,專用于修復保持時序違例。但原有庫中某些延時單元提供大延時的效率并不理想,新庫對此進行了改進設計。

  新庫通過設計特別的掃描路徑保持時序改善寄存器,減少系統(tǒng)保持時序違例,同時不影響系統(tǒng)功能路徑時序,改善芯片功耗[8]。

  2.2 低功耗布局與優(yōu)化

  一個好的布局和優(yōu)化不僅需要考慮系統(tǒng)時序和布線擁擠程度,也需要考慮整個系統(tǒng)的功耗水平。在布局和優(yōu)化階段,標準單元的選取、物理擺放、等價邏輯轉換、非關鍵路徑功耗優(yōu)化以及系統(tǒng)的總加權繞線長度等因素都與系統(tǒng)的功耗息息相關,如何在保證系統(tǒng)性能和繞線的基礎上降低功耗是低功耗設計的關鍵。在這方面,Innovus的GigaPlace和GigaOpt引擎為設計者提供了強有力的支持。通過Innovus的功耗驅動(power-driven)布局和功耗驅動優(yōu)化,可以有效開展三維驅動設計。

  2.2.1 布局與優(yōu)化方法分析

  為了達到最優(yōu)效果,本文對Innovus進行了多項測試,結果如表1。

圖像 015.png

  從表1中可以看到,Innovus通過新的功耗驅動引擎,在沒有任何功耗優(yōu)化的設置下,可改善總功耗3%。當引入更多的功耗優(yōu)化選項后,功耗最大可改善近5%。設計者可以根據芯片的應用需要,對動態(tài)功耗和靜態(tài)功耗的優(yōu)化比例進行選擇,工具可以根據選擇做出優(yōu)化策略的改變。另外,Innovus可以在布局階段考慮時鐘樹特殊布線的需求(ndrAwareOpt),從而與時鐘樹之后的設計更加匹配。本文也注意到,Innovus提供的“有用偏時”選項(usefulSkew)結果并不理想(本文也追蹤比較了時鐘樹之后的結果),需要進一步調試。

  表1顯示,當靜態(tài)優(yōu)化程度(leakage power effort)很高時,功耗整體優(yōu)化結果并不好。這其中的一個原因是90 nm工藝靜態(tài)功耗所占比例太低,另一個原因就是我們采用了加長溝道單元。加長溝道單元在大大降低器件漏電的同時,也會顯著提高器件的動態(tài)功耗。工具如果不能很好地從全局進行分辨取舍,就會影響功耗優(yōu)化效率。所以本文給出的建議是,禁止在布局和優(yōu)化階段使用加長溝道單元,引導工具更多地通過高閾值電壓單元和小尺寸單元優(yōu)化靜態(tài)功耗。加長溝道單元可以在時鐘樹后有選擇的進行使用。

  2.2.2 輸入向量驅動功耗優(yōu)化

  動態(tài)功耗的產生與芯片的運行狀態(tài)息息相關,默認情況下,工具使用默認的翻轉率來進行動態(tài)功耗的估算,這會與實際情況有很大偏差,在這種情況下進行動態(tài)功耗優(yōu)化,勢必影響功耗優(yōu)化效率。Innovus支持輸入向量驅動(VCD driven)優(yōu)化,本文測試結果如表2。

圖像 016.png

  表2顯示,工具在有特定輸入向量驅動的情況下,可針對此輸入模式進行精準動態(tài)功耗優(yōu)化(vector based optimization),從而有效改善(9.3%)此工作模式下的動態(tài)功耗優(yōu)化效果。所以本文建議在進行芯片物理設計時,可以加入典型芯片工作模式輸入向量,幫助工具更好地優(yōu)化芯片功耗。

  2.3 低功耗時鐘樹設計

  時鐘樹綜合是低功耗物理設計的重要內容,因為即使廣泛采用門控時鐘,芯片時鐘系統(tǒng)還是占據了整個芯片數字邏輯約40%的功耗比重。通常低功耗時鐘樹的設計方法有:

  (1)分析時鐘樹結構,設計合理時鐘樹綜合方案。

  (2)設置合理的時鐘偏斜(clock skew)和轉換時間(transition)要求。

  (3)嘗試不同緩沖器或倒相器時鐘樹方案,一般避免使用大尺寸(功耗大)和小尺寸(片上偏差OCV大)單元。使用低閾值單元進行時鐘樹綜合。

  (4)在片上偏差可接受范圍內,推薦多使用小尺寸門控時鐘單元。門控時鐘單元盡量靠近其驅動單元放置。

  (5)使用電阻電容小的金屬層進行時鐘樹布線,使用多孔(multi-cut)布線。

  (6)盡可能多地使用時鐘樹特殊布線,可有效減小時鐘樹電阻和耦合電容。

  (7)使用多位寄存器。

  現在低功耗時鐘樹的主流趨勢是時鐘樹綜合并不需要以“零時鐘偏斜”為目標。因為為了減小時鐘偏斜,時鐘樹上往往需要引入大量邏輯進行平衡,但很多時候這是沒有必要的,特別對于性能要求并不高的微控制器來說。允許時鐘偏差,對數據路徑和時鐘路徑協同優(yōu)化,避免引入不必要時鐘樹邏輯,在滿足時序要求的同時減少功耗,這就是時鐘樹協同優(yōu)化(CCOPT)的低功耗時鐘樹設計方法。

  Innovus使用新一代CCOPT引擎,幫助設計者進行良好的時鐘樹協同優(yōu)化設計。本文對兩塊芯片分別進行測試,結果分別如表3和表4。

圖像 017.png

  由表3和表4可知,通過時鐘樹協同優(yōu)化,可大大減少時鐘樹上的邏輯數量,從而有效減小時鐘功耗。雖然在后續(xù)時序優(yōu)化中,數據路徑上引入的邏輯數量會有所增加,但由于數據路徑的翻轉頻率大大低于時鐘路徑,所以并不會對整體功耗產生太大影響。

圖像 018.png

  2.4 時鐘樹后低功耗設計

  時鐘樹綜合后,芯片設計主要通過邏輯單元替換減少功耗。由于時鐘樹后芯片的時序計算越來越準確,這時可以通過減小邏輯單元尺寸、替換高閾值單元、替換加長溝道單元等方法進一步將非關鍵路徑上的冗余性能轉換為功耗節(jié)省。

  設計者可以通過Innovus的動態(tài)功耗優(yōu)化命令(optDynamicPower)進行單元替換,在滿足時序的前提下優(yōu)化功耗,通過測試(表5)可以看到這能夠帶來2~3%的功耗改善。這一過程同樣支持輸入向量驅動,并能達到更優(yōu)效果。

圖像 019.png

  在繞線與繞線后優(yōu)化階段,Innovus的功耗優(yōu)化能力同樣得到改善,經測試與上一代工具相比,功耗減少1.4%。如果在繞線后進一步打開“面積優(yōu)化”(area reclaim)選項,功耗能夠進一步改善4.6%。

  在這個階段,設計者可以考慮替換更多加長溝道單元進入芯片以有針對性地改善芯片靜態(tài)漏電。通常而言,靜態(tài)節(jié)點和準靜態(tài)節(jié)點可以放心使用加長溝道單元,低翻轉率節(jié)點也可以考慮使用加長溝道單元,高翻轉率節(jié)點不能引入加長溝道單元,低漏電模式下不掉電的單元應考慮加長溝道(典型的如SRPG中的常開鎖存器)。

  對于芯片中數量巨大的保持時序違例,設計者可以通過優(yōu)化延時單元與緩沖器使用組合的方法來減少使用數量,降低功耗。

  最后在時序違例基本干凈以后,能夠通過PBA(Path Based Analysis)方法進一步去除時序路徑上的性能冗余,減少不必要的功耗。這個步驟通常在靜態(tài)時序分析(STA)工具中進行,比如Cadence的Tempus。

3 結論

  本文借助于Cadence新一代布局布線工具Innovus,對傳統(tǒng)低功耗物理設計流程進行了全面優(yōu)化。內容包含低功耗標準單元庫設計,低功耗布局和優(yōu)化設計,低功耗時鐘樹設計和時鐘樹后低功耗設計。通過新的工具和方法,芯片數字部分功耗可改善15%,效果顯著。

  參考文獻

  [1] HUANG P,XING Z C,WANG T R,et al.A brief survey on power gating design[C].Solid-State and Integrated Circuit Technology(ICSICT),2010:788-790.

  [2] ZHANG Y L,TONG Q,LI L,et al.Automatic register transfer level CAD tool design for advanced clock gating and low power schemes[C].SoC Design Conference (ISOCC),2012 International:21-24.

  [3] GE Z,ZHANG J L,TAN M L.Module-based bus gating methodology in low power SoC design[C].27th IEEEInternational SOCC,Design Track Digest,2014:4-5.

  [4] RAO S M,BHATNAGAR H.Power reduction technique using multi-vt libraries[C].System-on-Chip for Real-Time Applications,Proceedings.Fifth International Workshop,2005:363-367.

  [5] GUPTA P,KAHNG A B,SHARRMA P,et al.Gate-length biasing for runtime-leakage control[J].IEEE Trans.Computer-aided design of integrated circuits and sysntems,2006,25(8):1475-1485.

  [6] HU J P,WANG J.Standard cell design of a low-leakage flip-flop with gate-length biasing[C].ASIC(ASICON),2011IEEE 9th International Conference,:361-364.

  [7] SANTOS C,REIS R,GODOI G,et al.Multi-bit flip-flop usage impact on physical synthesis[C].Integrated Circuits and Systems Design(SBCCI),2012 25th Symposium,pp.1-6.

  [8] GE Z,TAN M L.Scan-hold-timing-friendly flip-flop to improve chip routing and power[C].IEEE International SOCC 2015,Design Track Digest,Sep 2015:78-79.

  

  


此內容為AET網站原創(chuàng),未經授權禁止轉載。