123,123,123

TURBO51嵌入式微处理器功能验证

中电网

摘要： TURBO51的工程背景是TURBO51嵌入式微处理器结构设计上采取经时间考验过的32位机主流系统结构，在严格保证对8051指令集兼容的前提下，通过重新定义其处理器核的系统结构来挖掘处理器结构上的并行性实现

關(guān)鍵詞： 电子电路设计与仿真工具嵌入式微处理器 TURB051 RTL仿真

Abstract：

Key words :

1 引言

1. 1 背景

TURBO51的工程背景是TURBO51嵌入式微處理器結(jié)構(gòu)設(shè)計上采取經(jīng)時間考驗過的32位機(jī)主流系統(tǒng)結(jié)構(gòu)，在嚴(yán)格保證對8051 指令集兼容的前提下，通過重新定義其處理器核的系統(tǒng)結(jié)構(gòu)來挖掘處理器結(jié)構(gòu)上的并行性實現(xiàn)。在傳統(tǒng)8051軟件開發(fā)環(huán)境下實現(xiàn)本要由更高位寬的32位處理器來完成的工作并完全重用所有現(xiàn)有軟件資源。在 8051指令級多種尋址方式混合且指令不定長的現(xiàn)實下實現(xiàn)了高性能的體系結(jié)構(gòu)，亂序發(fā)射，分支預(yù)測，精確例外處理，基于猜測的先行預(yù)取，片上一級指令高速緩存。處理器系統(tǒng)結(jié)構(gòu)的復(fù)雜給驗證提出了很高的要求。而且，由于TURBO51 是作為SoC 的嵌入式處理器核，是整個大規(guī)模SOC 的控制核心和用戶接口，如果嵌入式處理器設(shè)計中驗證不完善或性能達(dá)不到設(shè)計要求，都會導(dǎo)致整個SoC 項目的開發(fā)致命失敗，因此對嵌入式處理器的驗證在SoC 設(shè)計中是最重要的部分之一。

一切對高性能體系結(jié)構(gòu)的追求都必須首先建立在以設(shè)計的正確性為前題才是有意義的。TURBO51的驗證面臨三個主要挑戰(zhàn):

( 1)正確性，所采用的高性能體系結(jié)構(gòu)也是復(fù)雜和高風(fēng)險的，只有設(shè)計正確才會帶給SoC 性能上的提升。

( 2)兼容性: 相對于傳統(tǒng)8051，在程序的執(zhí)行過程中，中斷和異常常會打斷程序的執(zhí)行，動態(tài)流水線的處理器由于指令的動態(tài)亂序執(zhí)行，但又必須對外部程序來說是和完全順序執(zhí)行只存在速度的差別而非結(jié)果的差別，所以它必須能精確地與順序執(zhí)行條件下的例外結(jié)果保持一致。

( 3)指令和操作數(shù)空間巨大，尋址方式復(fù)雜:

8051指令集共有111條指令，有多種尋址方式和不定的指令長度。另外， 8051指令集還將輸入輸出設(shè)備寄存器與體系結(jié)構(gòu)寄存器作為同種寄存器訪問。

這些都成為了結(jié)構(gòu)設(shè)計和驗證中的難點問題。

( 4)驗證充分性的衡量: 在驗證過程中根據(jù)發(fā)現(xiàn)錯誤的性質(zhì)、原因和數(shù)量分布，評估正確性程度和調(diào)整下面的驗證計劃，使驗證更深入，實現(xiàn)設(shè)計錯誤的快速收斂。

1. 2 微處理器驗證現(xiàn)狀

目前世界各處理器公司用于功能驗證的方式主要是模擬驗證，形式驗證，硬件仿真加速。但總的看來，由于指令集龐大，比如，它的完全無錯的測試向量的數(shù)量是指令條數(shù)階乘及每個操作數(shù)，地址數(shù)階乘。在有限的時間很難實現(xiàn)。除非指令和操作數(shù)的所有兩兩組合都已測試過，否則，即便經(jīng)過了這些驗證，也只能證明在測試已覆蓋地方正確而不能證明設(shè)計在任何情況下都正確。

形式驗證是指通過數(shù)學(xué)方法證明設(shè)計的完備性，即這種方法下的樣本空間是測試對象所有可能的狀態(tài)。A rithSMV， * PHDD。由于狀態(tài)樣本空間巨大，它只用設(shè)計屬性檢查工具，目前僅用于局部邏緝驗證。

模擬驗證: 包括RTL仿真和門級仿真。這一階段驗證的效果很大程度上由測試激勵和判定模擬結(jié)果的方法決定。在微處理器驗證中，采用匯編語言編寫測試激勵，運行操作系統(tǒng)，應(yīng)用程序和隨機(jī)生成測試向量。

硬件加速仿真: 為克服模擬仿真驗證速度慢的缺點，采用FPGA 的物理原型驗證可以在流片前運行操作系統(tǒng)和應(yīng)用程序，進(jìn)一步在系統(tǒng)級驗證正確性。

2 TURBO51的驗證方法

TURBO51在設(shè)計中用到了形式驗證、模擬仿真和硬件加速仿真。采用自底向上的子模塊級驗證再自頂向下的宏模塊及系統(tǒng)級驗證的方法。在整個設(shè)計過程中，驗證與設(shè)計是一個整體， TURBO51在進(jìn)行文檔時序設(shè)計時就同時開始針對正在進(jìn)行的設(shè)計編寫驗證計劃，設(shè)計和驗證的工作在設(shè)計文檔和驗證計劃中進(jìn)行精確到每個時鐘周期的行為描述和變量定義開始，是整個設(shè)計和驗證最重要的部分。由于TURBO51的設(shè)計要保證對傳統(tǒng)8051指令集的后向兼容， TURBO51采用兩臺可進(jìn)行單步調(diào)試的8051硬件仿真器，兩片傳統(tǒng)8051，兩片采用了簡單流水結(jié)構(gòu)的改進(jìn)版8051 作為正確標(biāo)尺。測試激勵在此先逐一運行，并將其運行結(jié)果作為界定執(zhí)行正確和兼容正確的標(biāo)準(zhǔn)。每個模塊在每個時鐘周期的每個寄存器讀寫和各個設(shè)計階段的驗證方法，驗證結(jié)果，問題分布，驗證策略在此規(guī)定，并手工編寫測試程序進(jìn)行仿真。在驗證文檔中記錄如何判定設(shè)計正確的與嚴(yán)重設(shè)計漏洞及原因，并在設(shè)計文檔中記錄哪些臨界態(tài)已考慮過了，為以后懷疑某種情況下有沒有可能是此出錯提供重要依據(jù)。在TURBO51的設(shè)計中覆蓋率指標(biāo)在文檔階段已經(jīng)引入，每個設(shè)計了的邏輯一定要用測試來證明有必要這樣設(shè)計和功能正確。功能設(shè)計中每個條件判斷總能在測試文檔中找到測這個條件的方法及判對標(biāo)準(zhǔn)。很多時候在寫測試方法時發(fā)現(xiàn)了很多設(shè)計中沒有考慮過的情況。功能設(shè)計文檔和以覆蓋率為指導(dǎo)的驗證文檔相互作用，使TURBO51在開始RTL之前就己經(jīng)完成了時序設(shè)計，寄存器定義及全部塊級測試的完全覆蓋，比如在寄存器重命名中多種尋地方式下對同一物理地址寫入的重命名，亂序發(fā)射，精確例外。一般說來，越是文檔級描述的錯誤越容易修改，越是硬件級的錯誤越難于發(fā)現(xiàn)，修改量很大且容易引入其他錯誤。

這個階段可以較容易用排列組合等進(jìn)行形式驗證進(jìn)行完全的情況覆蓋，排除了絕大部分嚴(yán)重錯誤，而且用于仿真的手工編寫的測試程序也用于此后的驗證中。RTL不過是文檔的一個V erilog 描述的翻譯過程，因此RTL并不是TURBO51設(shè)計最重要的地方，只是要按功能設(shè)計文檔和代碼檢查的要求可很快完成，但期間要用綜合結(jié)果指導(dǎo)對流水線負(fù)載平衡并在細(xì)節(jié)上進(jìn)一步調(diào)整，但每一處與原功能設(shè)計文檔描述不同的RTL修改首先是修改功能及驗證文檔，再次審核通過后才能改動RTL 代碼。仿真和RTL編寫是一體的，在Turbo51 驗證中分為模塊、宏模塊、系統(tǒng)級3個階段。只有在一個階段的設(shè)計和驗證及文檔完全達(dá)到計劃要求，即代碼檢查和代碼覆蓋率后才能再開始下一階段工作，這樣使得錯誤得以快速收斂。這期間把錯誤分為高風(fēng)險區(qū)錯誤和低風(fēng)險區(qū)錯誤。出現(xiàn)不正常時首先從影響程序運行走向的高風(fēng)險區(qū)開始排查，排除高風(fēng)險區(qū)的錯誤后再去找低風(fēng)險區(qū)錯誤。模塊級RTL 模擬仿真完成后就是宏模塊級，指令流水線， LOAD /STORE， Cache等，再下來是系統(tǒng)級RTL 仿真。在Turbo51 的設(shè)計驗證中，只有在TURBO51 整個的RTL代碼規(guī)范檢驗代碼覆蓋率達(dá)到RTL模擬仿真對覆蓋率的要求并通過設(shè)計描述文檔與驗證文檔相結(jié)合的審議通過后才可以再進(jìn)行FPGA 驗證。所以TURBO51設(shè)計驗證的底線是在FPGA 硬件原形驗證前至少排除全部會引起死機(jī)或兼容性的這類嚴(yán)重錯誤。TURBO51的設(shè)計驗證不是依賴下一階段測試發(fā)現(xiàn)本應(yīng)在上個階段發(fā)現(xiàn)并解決的錯誤，而是只用下階段確認(rèn)上階段目標(biāo)的完成。FPGA 驗證的目的是用于測試長時間在真實環(huán)境下運行應(yīng)用程序，因為畢竟很多對外部信號的響應(yīng)不易在RTL 仿真中模擬，而不是用來發(fā)現(xiàn)調(diào)試應(yīng)在仿真中排除的問題。

3 形式驗證

形式驗證的好處是它能遍歷全部狀態(tài)空間，可以實現(xiàn)驗證的完備。它在設(shè)計行為描述規(guī)格書中就開始使用，用于高風(fēng)險區(qū)的存貯訪問，高速緩存，分支預(yù)測，動態(tài)執(zhí)行，例外處理中最高風(fēng)險組合的完備性證明。比如在TURBO51 的片內(nèi)一級指令高速緩存的替換策略設(shè)計時，必須要處理每個可能的狀態(tài)，吞則可能會出現(xiàn)狀態(tài)機(jī)死鎖。在這里首先就是對是否有且僅有的幾種狀態(tài)進(jìn)行數(shù)學(xué)證明，然后再開始編寫功能行為描述和驗證計劃。這種方式可以使出錯影響大但狀態(tài)空間不大的邏輯達(dá)到完全正確，而且后來的事實也證明，通過形式的設(shè)計在此后的所有測試激勵下沒有出現(xiàn)異常。

形式驗證在TURBO51 驗證中的另一個地方是在進(jìn)行RTL代碼風(fēng)格檢查的時候用形式驗證工具對修改前后的RTL進(jìn)行功能比較，另外類似的做法也用于物理網(wǎng)表與前端網(wǎng)表的等價性比較。

4 RTL模擬仿真和覆蓋率及代碼風(fēng)格檢查

4. 1 RTL仿真

在功能時序文檔和制定RTL 模擬仿真計劃時，RTL編寫和模擬仿真在每個子模塊，宏模塊，系統(tǒng)級設(shè)計功能行為描述和驗證計劃完成后才開始，每個子模塊RTL編碼完成后放入用行為級描述的模型進(jìn)行仿真，再用EDA 工具提供的代碼檢查工具作RTL代碼檢查，再仿真直到達(dá)到代碼覆蓋率，然后層層向上做宏模塊和系統(tǒng)級的RTL 代碼檢查和基于代碼覆蓋率的仿真。驗證的主要排錯和測試在這個階段進(jìn)行，包括檢查是否與8051標(biāo)準(zhǔn)完全兼容的驗證，高風(fēng)險區(qū)的驗證和運行操作系統(tǒng)及應(yīng)用程序。

這里面使用了兩個標(biāo)準(zhǔn)，即由EDA工具給出的測試激勵對已設(shè)計邏輯的代碼覆蓋率和自己定義的臨界功能覆蓋率。

在模擬仿真中，對臨界指令組合采用手工匯編語言編寫激勵。在兼容性測試中，包括指令集測試，位尋址空間遍歷，上電測值測試，寄存器文件讀寫遍歷， LS變量RAM 遍歷，代碼空間分頁切換，中斷控制， 8051標(biāo)準(zhǔn)外設(shè)，定計， IO，擴(kuò)展外設(shè)驗證， SOC 總線讀寫， PWM 脈寬調(diào)制，在線程序燒入，基礎(chǔ)應(yīng)用:

軟件I2C讀寫，從外部讀取64KB 數(shù)據(jù)和系統(tǒng)測試，基于操作系統(tǒng)的遙控按鍵解碼和對片上其它器件的參數(shù)讀取。在此期間使用閃存的仿真模型，對于指令集測試，在現(xiàn)有商用軟件開發(fā)環(huán)境下創(chuàng)建測試激勵，對全部111條指令，按標(biāo)準(zhǔn)8051手冊上對每條指令的執(zhí)行結(jié)果值，按分支目標(biāo)，分支方向，對標(biāo)識位的影響這幾個方面進(jìn)行測試。先在基準(zhǔn)平臺上進(jìn)行單步運行，記下每條指令的每種狀態(tài)值，再將這些值作為正確依據(jù)，執(zhí)行完一項比較一項結(jié)果，如相同就繼續(xù)向前，同時一條IO 輸出一個方波，如不同則進(jìn)入本條指令結(jié)果，標(biāo)記，分支的死循環(huán)，通過查這個死循環(huán)地址便可快速定位是錯在哪條指令的什么地方，同時另一IO輸出另一種方波。此程序先在基準(zhǔn)平臺運行通過，不進(jìn)死循環(huán)，再把它轉(zhuǎn)成數(shù)據(jù)文件導(dǎo)入仿真模型。寄存器文件讀寫也是依據(jù)8051手冊，區(qū)分不同尋址方式對應(yīng)的寄存器文件。在測試結(jié)果中，最重要的一個觀測點是指令提交地址寄存器，它記錄了真正的處理器運行走向，只要它未出現(xiàn)異常，這個測試項就認(rèn)為無嚴(yán)重錯誤。RTL模擬在TURBO51中分為測試激勵生成，結(jié)果檢測和覆蓋率分析三個部分。TURBO51采用了手工編寫臨界條件和基礎(chǔ)測試程序，通過后再運行實際應(yīng)用程序和操作系統(tǒng)。此階段完成的標(biāo)準(zhǔn)是對代碼和功能覆蓋率的檢查。在模塊級RTL的編寫過程中一邊對代碼風(fēng)格和仿真測試覆蓋率進(jìn)行檢查，同時進(jìn)行綜合以測試關(guān)鍵路徑對設(shè)計時序的滿足。作為輔助驗證，自動指令生成指令庫，指令生成控制器生成的測試激勵同時也在一個行為級8051指令集模擬器仿真模型中一起運行，逐條進(jìn)行結(jié)果比較，當(dāng)發(fā)現(xiàn)結(jié)果不一致時對指令進(jìn)行記錄，當(dāng)發(fā)現(xiàn)分支不一致時仿真停止或仿真量到達(dá)一定規(guī)模時也停止仿真，供查看代碼覆蓋率用。

4. 2 覆蓋率和代碼風(fēng)格檢查

基于模擬仿真的驗證的困難是無論采用的測試激勵是來自真實應(yīng)用還是指令自動生成，都無法證明整個處理器不出錯。因此TURBO51仿真驗證的完成標(biāo)準(zhǔn)是在錯誤收斂了的情況下增加更多的測試向量，使EDA 工具提供的設(shè)計邏輯覆蓋率達(dá)到塊級100%和表達(dá)式級93% ，功能覆蓋率達(dá)到100% 。

功能覆蓋率的測試是設(shè)計規(guī)格書中定義的全部行為和驗證計劃的全部臨界點。在進(jìn)行覆蓋率檢查的過程中，可以得出目前的總覆蓋率和對一個模塊中某個狀態(tài)未被測試向量覆蓋的邏緝和輸入值，它指明了漏洞存在，指導(dǎo)手工編寫直接針對未覆蓋邏緝的測試。另外代碼覆蓋在TURBO51的設(shè)計中也被用于排除冗余或重復(fù)的邏輯，節(jié)省不必要的關(guān)鍵路徑開銷和邏輯資源。代碼檢查: 代碼檢查使用EDA 工具所提供的功能。使代碼在綜合中不會產(chǎn)生異常，使模擬仿真的結(jié)果與FPGA 不一致。在這里用形式驗證工具對修改后和修改前的代碼進(jìn)行等價性比較。表1是各大模塊的RTL 仿真代碼覆蓋率，表2是主要模塊在不同測試激勵下的代碼塊覆蓋率和表達(dá)式覆蓋率。均由Cadence Incisive 給出。

表1 主要模塊代碼測式覆概率。

主要模塊代碼測式覆概率

表2 主要模塊在不同的測試激勵下的覆蓋率

主要模塊在不同的測試激勵下的覆蓋率

5 物理原型驗證

物理原型驗證是AS IC 設(shè)計中通常采用的另一種重要的驗證手段。它是將RTL 描述通過針對FPGA目標(biāo)器件的綜合及優(yōu)化，布局布線及優(yōu)化并同時進(jìn)行了靜態(tài)時序分析后形成ASIC 設(shè)計的另一種物理實現(xiàn)形式。它能比RTL 模擬仿真更接近真實的AS IC，能在系統(tǒng)板上在功能上完全取代ASIC 進(jìn)行工作，但最高速度一般比ASIC 慢一半以上。在這些都完成并通過了設(shè)計描述文檔和驗證文檔的審核后進(jìn)行FPGA 硬件加速仿真，完全在系統(tǒng)應(yīng)用環(huán)境下檢驗兼容性及正確性并做出初步性能*測。相對于仿真而言，它能在提高系統(tǒng)運行速度上提高幾個數(shù)量級。

TURBO51的FPGA 驗證的前提是設(shè)計已經(jīng)過了關(guān)鍵點的形式驗證，完成了塊覆蓋率為100% 的RTL仿真及代碼檢查且錯誤已收斂完畢，故對FPGA驗證的首要目的是通過運行和真實應(yīng)用環(huán)境完全相同的完整目標(biāo)應(yīng)用系統(tǒng)驗證兩步的錯誤估計是否正確并配合其他SOC 模塊作SOC 協(xié)同驗證。因為對有的仿真做起來不方便的系統(tǒng)驗證在FPGA 平臺上很方便驗證。在TURBO51的FPGA 驗證中，充分利用了FPGA 上的剩余資源，用于實時定位與監(jiān)測TURBO51的FPGA 實現(xiàn)版每個時鐘的狀態(tài)及其運行狀態(tài)，這其實已使原本認(rèn)為FPGA 上難于定位錯誤的缺陷大為改觀，在真實環(huán)境下運行系統(tǒng)提供了非常接近RTL仿真的調(diào)試能力的觀測窗口。這里依然首先選用了指令提交地址和指令取指地址，累加器， B 寄存器，程序狀態(tài)字PSW，重定序緩沖狀態(tài)，例外處理標(biāo)識，寫回總線，提交總線位為主要觀察點，顯示每個時鐘的狀態(tài)，將它們協(xié)同SOC 其它模塊的輸出，示波器觀測輸出波形結(jié)果一起形成FPGA 驗證結(jié)果。TURBO51在FPGA 驗證時工作在60MH z，除運行全部手工編寫的用于模擬仿真的測試程序外，還成功連續(xù)兩百小時運行全部現(xiàn)有量產(chǎn)的基于RTOS商用系統(tǒng)及其極限條件，沒有發(fā)現(xiàn)嚴(yán)重錯誤。通過對寄存器值的實時監(jiān)測發(fā)現(xiàn)十處以內(nèi)的外設(shè)非致命錯，比如GPIO 與外設(shè)輸入輸出復(fù)用。

當(dāng)然，每改一次RTL或監(jiān)視寄存器都需要重新進(jìn)行FPGA 燒寫文件的生成， TURBO51耗時近兩小時，故它仍然不可能取代仿真。完成FPGA 驗證后做準(zhǔn)備流片的工廠提供的工藝標(biāo)準(zhǔn)單元庫綜合及靜態(tài)時序分析，交出網(wǎng)表做后端布局布線，完成后再用帶門延時的后端門級網(wǎng)表進(jìn)行門級仿真，最后編寫樣片基臺測試程序。

6 驗證結(jié)果分析

由于最初在制定實現(xiàn)的方法和制定驗證計劃時是同步進(jìn)行的，致使整個設(shè)計階段的錯誤累積。在TURBO51的設(shè)計和驗證中，首先用形式驗證將最高風(fēng)險的存貯訪問，高速緩存，分支預(yù)測，動態(tài)執(zhí)行，例外處理中的最高風(fēng)險組合進(jìn)行完備證明，使錯誤得以排除。在此后的驗證中，凡經(jīng)形式驗證正確的部分再未出現(xiàn)過異常，如圖1所示。

圖1 錯誤時間累計統(tǒng)計。

這樣使得全部的高風(fēng)險錯誤在RTL仿真的中期已經(jīng)全部排除并且大多數(shù)都由手工編寫的測試激勵完成。由于8051指令集指令死角空間相對較小，手工編寫可行。其中大部分RTL 仿真發(fā)現(xiàn)的錯是IO設(shè)備錯誤與處理器指令執(zhí)行部分無關(guān)。如圖2所示，錯誤99. 7% 百分比在FPGA 驗證前已收斂，故可認(rèn)定前面工作扎實有效。假如一個設(shè)計如果在FPGA 驗證階段錯誤還未能收斂完，還能發(fā)現(xiàn)大量新增錯誤尤其是嚴(yán)重錯誤的話，這說明仿真及行為模型描述與驗證計劃都存在嚴(yán)重問題，應(yīng)退回去重走一遍，否則流片風(fēng)險較大。

不同驗證階段發(fā)現(xiàn)的錯誤分布統(tǒng)計

圖2 不同驗證階段發(fā)現(xiàn)的錯誤分布統(tǒng)計。

7 總結(jié)和未來工作

TURBO51嵌入式微處理器使用了上述多種驗證方法使得越嚴(yán)重的錯誤得到了越早的收斂，加上高的RTL代碼覆蓋率及長時間在FPGA 上成功運行了全部目標(biāo)應(yīng)用程序及所有仿真測試程序，表明設(shè)計正確且兼容性完備，使TURBO51嵌入式微處理器順利采用富士通微電子(日本) 90nmCMOS 工藝一次流片成功。但另一方面，可配置約束的自動隨機(jī)指令序列已在更復(fù)雜的處理器驗證中越來越廣泛地采用， TURBO51的驗證中在這一方面目前還處于初級階段，這將是以后的主要改進(jìn)方向。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容