最近,英國(guó)Ascot的Agere系統(tǒng)公司 ASIC設(shè)計(jì)中心從一個(gè)重要客戶(hù)處收到一份富有挑戰(zhàn)性的簡(jiǎn)報(bào):將8個(gè) ARM966E-S r1p0 處理器子系統(tǒng)集成到單芯片上。
盡管這項(xiàng)任務(wù)很復(fù)雜,但是僅花了11個(gè)月就完成了4M-gate 5Mbit 的設(shè)計(jì)。目前,芯片已投入生產(chǎn),并作為首次推出的基礎(chǔ)設(shè)施的一部分,于2002年在歐洲首次使用。整個(gè)芯片是第三方和Agere設(shè)計(jì)經(jīng)驗(yàn)的合作成果,Agere負(fù)責(zé)提供ARM子系統(tǒng)設(shè)計(jì)經(jīng)驗(yàn)和芯片集成知識(shí),而第三方提供特定用途知識(shí)產(chǎn)權(quán)。
本文不僅概括了小組在開(kāi)發(fā)設(shè)計(jì)過(guò)程中遇到的挑戰(zhàn),還提供了對(duì)所采用的解決方案的深刻見(jiàn)解。使用的技術(shù)有Agere的0.16um 6LM (金屬層) 1.5V/3.3V處理,且連線(xiàn)到456 PBGAM數(shù)據(jù)包,以及Agere的內(nèi)部EDA工具集、用于合成的Synopsys的設(shè)計(jì)編譯器、用于靜態(tài)時(shí)序分析的Primetime、用于測(cè)試插入和矢量生成的DC-XP/Tetramax和用于功耗分析的Primepower。小組使用了Avanti Apollo/Saturn 的布局規(guī)劃和時(shí)鐘樹(shù)綜合(CTS)技術(shù)、Mentor Graphics的Modelsim RTL 仿真技術(shù)和Cadence的NCVerilog 功能門(mén)仿真技術(shù)。 Celerity是用于Spice仿真的解決方案,而AssuraSI是用于信號(hào)集成分析的解決方案。
ARM966E-S子系統(tǒng)
本設(shè)計(jì)是分等級(jí)的,它將ARM966E-S子系統(tǒng)排在最低級(jí)別。子系統(tǒng)的結(jié)構(gòu)如圖所示。
每個(gè)ARM966E-S子系統(tǒng)在每段設(shè)計(jì)里可使用2次,并同時(shí)添加第三方IP。而該段在設(shè)計(jì)中被復(fù)制4次。在層次的上一級(jí)也包括了第三方IP,最后,包括Agere所有的IO和測(cè)試結(jié)構(gòu)。該結(jié)構(gòu)在圖2中有說(shuō)明。使用該設(shè)計(jì)結(jié)構(gòu),Agere提出了SoC設(shè)計(jì),即當(dāng)設(shè)備中的最低核心電壓是1.32V,接合溫度達(dá)到125 攝氏度,且使用最慢處理特性時(shí),這種設(shè)計(jì)最少能容納1280 MIPS,是基于每個(gè)ARM966E-S核心160 MIPS的一種測(cè)量方法。在這些條件下,限制MIP數(shù)目的因素不是ARM966E-S核心(在這種技術(shù)下能達(dá)到200MIPs),而是指令/數(shù)據(jù)緊密耦合內(nèi)存 (TCM)的大小和形狀,以及AMBA 高速總線(xiàn) (AHB)的物理長(zhǎng)度。在Agere的最新技術(shù)(0.13um)里,已獲得不止兩倍的性能,同時(shí)使用AMBA 3.0 AXI協(xié)議,克服了AHB的局限性。
多核設(shè)備結(jié)構(gòu)" border="0" height="369" hspace="0" src="http://files.chinaaet.com/images/20100812/d0f94d6e-d584-4e0b-a329-cd20203d133d.jpg" width="520" />
子系統(tǒng)設(shè)計(jì)工藝基礎(chǔ)是Agere的 "AHB Supercore macrocell"。 Agere利用子系統(tǒng)的開(kāi)發(fā)經(jīng)驗(yàn),使Supercore滿(mǎn)足了SoC設(shè)計(jì)的要求。這就要求更改TCM配置,包括將部分?jǐn)?shù)據(jù)TCM內(nèi)存映射變?yōu)殡p口RAM。而且,增加了一個(gè)雙向的外部存儲(chǔ)接口(EMI) 和一個(gè)定制的矢量中斷控制器(VIC)。
測(cè)試設(shè)計(jì)功能性
一旦完成ARM966E-S子系統(tǒng)的RTL設(shè)計(jì),Agere的工程師就創(chuàng)建了一套系統(tǒng)測(cè)試,以證明設(shè)計(jì)的功能性。除了可以測(cè)試ARM提供的矢量外,還可以測(cè)試合成的ARM966E-S核心的有效性。用于測(cè)試子系統(tǒng)的測(cè)試基準(zhǔn)使用了Synopsys LMC (邏輯模型化公司)軟內(nèi)存模式仿真TCM。
該測(cè)試組件還用于檢驗(yàn)各個(gè)步驟的分塊合成和構(gòu)造。一旦子系統(tǒng)設(shè)計(jì)人員確定了整個(gè)設(shè)計(jì)的合成,就會(huì)在融合到整個(gè)SoC設(shè)計(jì)前,將單獨(dú)的驗(yàn)證結(jié)果傳給SoC設(shè)計(jì)人員。為了遵守ARM許可協(xié)議,無(wú)需ARM966E-S門(mén)級(jí)連線(xiàn)表,而是與ARM966E-S DSM系統(tǒng)仿真的DSM(設(shè)計(jì)仿真模式)一并傳給第三方。
這是一個(gè)復(fù)雜的SoC設(shè)計(jì),不僅需要測(cè)試性能,還需要相關(guān)的調(diào)試。將BIST、SCAN和邊界掃描結(jié)構(gòu)包含在內(nèi),才有可能對(duì)整個(gè)設(shè)計(jì)的高故障覆蓋生產(chǎn)進(jìn)行測(cè)試。如果需要調(diào)試,除了需要一個(gè)結(jié)構(gòu)外,還需添加支持ICE在線(xiàn)仿真的ETM9 (內(nèi)置的蹤跡模塊)。
尤其是掃描技術(shù),它不同于以往一次性?huà)呙枵麄€(gè)芯片的方法。每個(gè)分層的掃描都是單獨(dú)進(jìn)行的,然后合并起來(lái)進(jìn)入上一級(jí)。這里主要的工作區(qū)將所有以前掃描過(guò)的子模塊當(dāng)作黑盒子來(lái)處理,直至插入了掃描。之后在填寫(xiě)設(shè)計(jì)連線(xiàn)表前,子模塊代替設(shè)計(jì)中的黑盒子,為上一級(jí)掃描和合并做準(zhǔn)備。這個(gè)過(guò)程在4 種不同層次上都有重復(fù)。從設(shè)計(jì)開(kāi)始,Synopsys已發(fā)布了新版的設(shè)計(jì)編譯器,Agere用它成功掃描和編譯了許多復(fù)雜的分級(jí)設(shè)計(jì),而無(wú)需精心制作的腳本。
邊界掃描結(jié)構(gòu)設(shè)計(jì)使所有IO計(jì)時(shí)在IO和電壓轉(zhuǎn)換結(jié)構(gòu)中都是可預(yù)料的。這應(yīng)當(dāng)通過(guò)創(chuàng)建IO緩沖和邊界掃描物理布局宏單元獲得。這些宏單元與Agere的BCADu軟件相結(jié)合,建立最高級(jí)IO連接。每種接入接出宏單元都轉(zhuǎn)換為正確的電壓,并接收不同的掃描輸入和輸出。
這就意味著功能信號(hào)在核心內(nèi)不會(huì)與掃描信號(hào)相混淆。從而,隨著設(shè)計(jì)的進(jìn)行,實(shí)現(xiàn)從頂級(jí)透視預(yù)測(cè)整個(gè)時(shí)序。IO環(huán)設(shè)計(jì)的另一特性是將邊界掃描時(shí)鐘TCK發(fā)送給數(shù)據(jù)的另一端。這就消除了與TCK有關(guān)的任何保留時(shí)序問(wèn)題,同時(shí)意味著不必?fù)?dān)心時(shí)序平衡和芯片外圍的TCK時(shí)鐘樹(shù)。
由于這種設(shè)備是基于ARM的,且具有ICE性能,與IO邊界共享JTAG端口,所以需要進(jìn)行掃描。設(shè)計(jì)的TDO針需要在每?jī)蓚€(gè)測(cè)試結(jié)構(gòu)間復(fù)用。為了實(shí)現(xiàn)這一特性,將邊界掃描控制器(Agere開(kāi)發(fā)的BCAD軟件部分)變?yōu)榭芍С诌吔鐠呙杌騃CE。
復(fù)雜設(shè)計(jì)需要足夠的調(diào)試性能
ICE和ETM性能都添加到SoCy設(shè)計(jì)中。在設(shè)計(jì)規(guī)格階段,為每個(gè)ARM966E-S提供一個(gè)獨(dú)立的ETM9,費(fèi)用會(huì)很大,而且因?yàn)? 個(gè)ARM966E-S都具有同一功能,所以只需要其中的一個(gè)ARM966E-S。因此單個(gè)的ETM9放在核心最上層,并連接到單芯片的單ARM966E-S核心中,其它三個(gè)芯片的ETM接口未被連接。
SoC 設(shè)計(jì)的ICE性能需要依靠所有8個(gè)ARM966E-S核,能經(jīng)由設(shè)備的JTAG端口,通過(guò)TDI/TDO信號(hào)進(jìn)行通信。因?yàn)閾碛卸鄠€(gè)JTAG端口的解決方案并不很實(shí)用,因而有必要利用ARM966E-S的菊花鏈通信性能。菊花鏈控制的說(shuō)明見(jiàn)圖3。菊花鏈系列連接要求在每?jī)蓚€(gè)ARM966E-S核間進(jìn)行數(shù)據(jù)傳送,并意味著較低級(jí)別的TCK時(shí)鐘平衡變得重要了。為了使多ICE能以實(shí)用的調(diào)試速率運(yùn)行,TCK時(shí)鐘樹(shù)必須首先在芯片間,然后在芯片內(nèi)的ARM966E-S間達(dá)到平衡。
因?yàn)樵O(shè)備不包含只讀存儲(chǔ)器(ROM),所以在通電時(shí),需要啟動(dòng)系統(tǒng)將軟件下載到每個(gè)核。需通過(guò)主要外部接口,到達(dá)每個(gè)子系統(tǒng)的AHB基礎(chǔ)存儲(chǔ)器。然后處理器開(kāi)始啟動(dòng),并將主程序傳輸?shù)絻?nèi)核的指令TCM。
富有挑戰(zhàn)性的物理執(zhí)行
此Soc設(shè)計(jì)的物理執(zhí)行是使用Avanti的 Apollo 和Saturn來(lái)實(shí)現(xiàn)TDL(時(shí)序驅(qū)動(dòng)布局)和CTS (時(shí)鐘樹(shù)整合)的。目前Synopsys Astro已經(jīng)替代了這個(gè)流程。8個(gè)內(nèi)核的設(shè)計(jì),可能產(chǎn)生有趣的挑戰(zhàn)。設(shè)備的形狀由ARM966E-S子系統(tǒng)的大小和形狀規(guī)定,并受芯片形狀和大小的影響。通過(guò)這個(gè)設(shè)備的數(shù)據(jù)流主要是單向的,同時(shí)影響到平面布局圖。這就意味著唯一的可能就是在各自頂端堆疊芯片。于是要求制定長(zhǎng)線(xiàn)(> 3mm)轉(zhuǎn)發(fā)器信號(hào)策略,同時(shí),因?yàn)槊總€(gè)芯片與來(lái)自芯片四個(gè)方向的信號(hào)通信,所以要求大量的轉(zhuǎn)發(fā)器元。這就迫使Agere的設(shè)計(jì)小組在平面布局圖中采用轉(zhuǎn)發(fā)器區(qū)域,管理利用轉(zhuǎn)發(fā)器元的數(shù)量。隨著信號(hào)傳送距離變長(zhǎng)(> 20mm),就會(huì)對(duì)計(jì)時(shí)產(chǎn)生影響,于是要求重新設(shè)計(jì)SoC的某些方面,以提供更多的管線(xiàn)級(jí)數(shù),確保時(shí)序不受干擾。
如果這個(gè)設(shè)計(jì)很大(> 140mm^2),有大量的初級(jí)IO信號(hào),同時(shí)大于數(shù)據(jù)中的125K觸發(fā)器,那么就應(yīng)特別注意其功耗、IR壓降及IO和時(shí)鐘交換引起的噪音。通過(guò)精確的嵌入時(shí)延管理,確保每個(gè)芯片的計(jì)時(shí),從而減少設(shè)備功耗、IR 壓降和時(shí)鐘噪音。芯片外的電路記錄對(duì)邊的時(shí)間,另外金屬的附加級(jí)也添加,僅用于功率路由。然而即使利用這些技術(shù),設(shè)計(jì)人員仍認(rèn)為電壓能降到1.32V(Agere0.16um 1.5V 庫(kù)中最小的典型電壓)。隨后計(jì)時(shí)分析和模擬這個(gè)更低的電壓特征,并產(chǎn)生設(shè)備計(jì)時(shí)分析和模擬的SDF(標(biāo)準(zhǔn)時(shí)延格式)。
對(duì)這一種類(lèi)的設(shè)備,另一值得考慮的事項(xiàng)是地面反彈分析。需要考慮要求的VDD 和VSS板的數(shù)目,然后使用Celerity SPICE模擬器對(duì)芯片進(jìn)行仿真,同時(shí)使用所有的輸出交換。相應(yīng)地,測(cè)量輸出緩沖驅(qū)動(dòng)容量,調(diào)整VDD/VSS板的數(shù)目和基調(diào)。然后再進(jìn)行一個(gè)相似的仿真,評(píng)估內(nèi)核電源板的需求。最后由于這是一種混合的電壓設(shè)計(jì),我們?yōu)?.3V交換 IO 和1.5V內(nèi)核電壓重新設(shè)計(jì)一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)基底,以合并電源層,從而減少連接到VDD 和VSS電源的感應(yīng)。
Agere實(shí)現(xiàn)了布局內(nèi)的時(shí)序閉合后,就會(huì)利用其信號(hào)集成分析工具方法,評(píng)估假信號(hào)問(wèn)題,以及信號(hào)耦合引起的時(shí)序問(wèn)題。圖4演示了Agere的SI流程。
當(dāng)時(shí),這個(gè)方法還是相對(duì)較新的。這些工具雖然已經(jīng)十分先進(jìn)了,但仍沒(méi)有現(xiàn)在的先進(jìn)。于是導(dǎo)致了許多反復(fù)設(shè)計(jì),在修復(fù)了潛在問(wèn)題后,再進(jìn)行進(jìn)一步的信號(hào)集成分析,這樣才能完成整個(gè)設(shè)計(jì)。
這樣的設(shè)計(jì)以及許多同樣復(fù)雜的后續(xù)設(shè)計(jì)的結(jié)果是:Agere工具的信號(hào)集成能力得到很好的調(diào)整,以致于單個(gè)信元具有獨(dú)特的門(mén)限特征,產(chǎn)生了新的SI 加強(qiáng)型信元(hardened cell),以及用于更高精度模塊化的單網(wǎng)分析。這就使易受當(dāng)前信號(hào)完整性問(wèn)題影響的網(wǎng)絡(luò)數(shù)量大幅下降,從而讓我們能集中精力解決真正的問(wèn)題。相應(yīng)地,Agere現(xiàn)在利用了Synopsys Astro Cross-talk工具進(jìn)行布局設(shè)計(jì),并采用時(shí)鐘屏蔽作為標(biāo)準(zhǔn),消除時(shí)鐘故障問(wèn)題。同時(shí),Agere 還采用了Cadence的Celtic工具代替圖4 SI 流程中的Assura工具。
總之,這是個(gè)十分苛刻的SoC設(shè)計(jì),需要開(kāi)發(fā)新的設(shè)計(jì)技術(shù)才能成功實(shí)現(xiàn)。這些技術(shù)已經(jīng)逐漸被應(yīng)用到Agere的其它設(shè)計(jì)中,而且到目前為止,位于英國(guó)Ascot 的Agere設(shè)計(jì)中心已完成了7種不同技術(shù)的基于ARM的設(shè)計(jì),包括Agere最新的0.13um技術(shù),而整個(gè)公司已經(jīng)擁有了30種基于ARM的設(shè)計(jì)方案。