文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2010)11-0035-04
對(duì)于包含多主設(shè)備的片上系統(tǒng),采用共享總線的結(jié)構(gòu)具有實(shí)現(xiàn)簡(jiǎn)單和硬件開(kāi)銷較少的優(yōu)勢(shì),已成為設(shè)計(jì)的主要手段。在共享總線結(jié)構(gòu)中,多個(gè)總線主設(shè)備競(jìng)爭(zhēng)使用總線控制權(quán),不可避免地會(huì)產(chǎn)生競(jìng)爭(zhēng)和沖突,為有效解決沖突,設(shè)計(jì)了總線仲裁器來(lái)決定總線上哪個(gè)主設(shè)備獲得總線的使用權(quán)。但是,各總線主設(shè)備會(huì)有不同的實(shí)時(shí)性和帶寬的要求,所以,總線仲裁器必須采取合理的策略和高性能的調(diào)度算法來(lái)滿足各主設(shè)備的要求。目前,常用的總線仲裁算法有:固定/動(dòng)態(tài)優(yōu)先權(quán)算法FP/DP(Fix/Dynamic Priority)、時(shí)分復(fù)用算法TDMA(Time Division Multiple Access)、時(shí)間片輪轉(zhuǎn)算法RR(Round Robin)和彩票算法(Lottery)。文獻(xiàn)[1]-[3]已經(jīng)證明了這些傳統(tǒng)算法不能很好地滿足各主設(shè)備實(shí)時(shí)性和帶寬要求。目前,不少學(xué)者對(duì)傳統(tǒng)算法進(jìn)行了改進(jìn),如文獻(xiàn)[4]把Lottery算法改進(jìn)成三級(jí)總線仲裁機(jī)制;文獻(xiàn)[5]通過(guò)自適應(yīng)的動(dòng)態(tài)調(diào)整“彩票”數(shù)來(lái)改進(jìn)Lottery算法;文獻(xiàn)[6]則提出了一種基于傳輸時(shí)間精確預(yù)測(cè)的仲裁算法。但是,這些改進(jìn)算法也都沒(méi)有考慮主設(shè)備請(qǐng)求總線服務(wù)的緩急程度。因此,本文提出一種基于搶占閾值的最小空閑時(shí)間優(yōu)先PT-LSF(Preemption Threshold-Least Slack First)服務(wù)的片上總線仲裁算法。該算法在收集主設(shè)備請(qǐng)求(服務(wù)時(shí)間和截止時(shí)間等)特性參數(shù)和總線傳輸狀態(tài)信息的基礎(chǔ)上,通過(guò)PT-LSF算法的調(diào)度結(jié)果,實(shí)時(shí)動(dòng)態(tài)地改變主設(shè)備優(yōu)先權(quán),以滿足主設(shè)備強(qiáng)實(shí)時(shí)性要求。
1 基于最小空閑時(shí)間優(yōu)先的總線仲裁算法原理及實(shí)現(xiàn)
1.1 算法原理
記空閑時(shí)間Si定義為從當(dāng)前時(shí)刻t直到其截止期di的時(shí)間與其剩余服務(wù)時(shí)間ci(t)之間的差,則最小空閑時(shí)間優(yōu)先調(diào)度算法的策略是:按照主設(shè)備的空閑時(shí)間動(dòng)態(tài)地分配優(yōu)先級(jí)p,可由式(1)確定:
pi=pmax-Si (1)
空閑時(shí)間越短,主設(shè)備的優(yōu)先級(jí)就越高,因此選擇具有最小空閑時(shí)間的主設(shè)備獲得總線的使用權(quán)。假設(shè)某個(gè)主設(shè)備Ti發(fā)出請(qǐng)求總線服務(wù)請(qǐng)求時(shí),總線正被具有更高優(yōu)先級(jí)的其他主設(shè)備Tj所占用,從而阻止了Ti使用總線。隨著時(shí)間的推移,Ti的空閑時(shí)間嚴(yán)格單調(diào)遞減直至小于正占用總線的主設(shè)備Tj的空閑時(shí)間時(shí),按照調(diào)度策略,總線必須切換到服務(wù)Ti。
1.1.1 總線顛簸現(xiàn)象
由于等待主設(shè)備的空閑時(shí)間隨時(shí)間嚴(yán)格遞減,當(dāng)有多個(gè)任務(wù)等待主設(shè)備時(shí),其空閑時(shí)間不斷變化,所以會(huì)出現(xiàn)多個(gè)主設(shè)備相互交叉搶占總線服務(wù)的現(xiàn)象。每次搶占都發(fā)生一次總線切換,造成總線服務(wù)顛簸現(xiàn)象。由于總線服務(wù)切換的時(shí)間不可忽略,而且會(huì)加大仲裁器的設(shè)計(jì)難度,浪費(fèi)資源,因此必須有效地避免顛簸現(xiàn)象。顛簸現(xiàn)象的產(chǎn)生主要是因?yàn)榈却?wù)主設(shè)備Ti的空閑時(shí)間Si一旦小于服務(wù)主設(shè)備Tj的空閑時(shí)間Sj,就馬上進(jìn)行總線服務(wù)切換,所以選擇合適的切換時(shí)機(jī)可以有效地解決顛簸現(xiàn)象。本文引入搶占閾值來(lái)擴(kuò)展最小空閑時(shí)間優(yōu)先服務(wù)的總線仲裁算法。
1.1.2 搶占閾值的確定
記pi為主設(shè)備Ti的優(yōu)先級(jí),hi為主設(shè)備Ti的切換閾值。根據(jù)之前的分析,主設(shè)備的優(yōu)先值越大,其優(yōu)先級(jí)就越高,所以主設(shè)備的切換閾值必須大于其優(yōu)先值,即hi>pi。因?yàn)閜i的值是動(dòng)態(tài)變化的,所以hi值不能事先確定,需要隨時(shí)間進(jìn)行動(dòng)態(tài)修改??紤]到總線仲裁過(guò)程實(shí)時(shí)性要求很高,hi值的確定不宜過(guò)于復(fù)雜,所以本文采用線性法來(lái)設(shè)計(jì)。對(duì)于任意Ti,hi的值由式(2)確定:
1.2 算法流程
算法流程如下:
(1)算法初始化;
(2)檢測(cè)是否有主設(shè)備請(qǐng)求總線服務(wù),有則初始化主設(shè)備(假設(shè)為Ti)的參數(shù)(優(yōu)先級(jí)pi=pmax;切換閾值hi=hmax;空閑時(shí)間Si),并加入等待服務(wù)主設(shè)備隊(duì)列T′中;
(3)對(duì)T′中的每個(gè)主設(shè)備計(jì)算Si;
(4)判斷總線是否正在服務(wù),是則轉(zhuǎn)(5),否則轉(zhuǎn)(7);
(5)對(duì)T′中的所有Ti,計(jì)算Si-Sj,結(jié)果小于0則加入就緒服務(wù)主設(shè)備隊(duì)列T″中,轉(zhuǎn)(6);
(6)判斷T″是否為空,是則轉(zhuǎn)(9),否則對(duì)T″中的每個(gè)主設(shè)備計(jì)算pi=pi-hj,如果max(pi)>0設(shè)置Ti的優(yōu)先級(jí)最高,減小pj,轉(zhuǎn)(7);
(7)對(duì)優(yōu)先級(jí)最高的Ti進(jìn)行服務(wù),轉(zhuǎn)(8);
(8)修改各主設(shè)備參數(shù),按照式(1)修改pi,式(2)修改hi;判斷T′中的主設(shè)備是否服務(wù)完,是則轉(zhuǎn)(9),否則轉(zhuǎn)(2);
(9)算法結(jié)束。
1.3 算法實(shí)現(xiàn)
基于閾值的最小空閑時(shí)間優(yōu)先服務(wù)的片上總線仲裁算法由4個(gè)基本模塊組成:算法控制模塊、優(yōu)先級(jí)調(diào)節(jié)器、帶寬調(diào)節(jié)器和總線傳輸控制器。另外,算法所需的主設(shè)備訪問(wèn)總線特性參數(shù)(服務(wù)時(shí)間、截止時(shí)間等)和總線服務(wù)參數(shù)信息由信號(hào)提取模塊完成,信號(hào)的控制和實(shí)際數(shù)據(jù)的傳輸由信號(hào)授權(quán)模塊完成,其總體結(jié)構(gòu)如圖1所示。
(1)優(yōu)先級(jí)調(diào)節(jié)器
該模塊的主要作用是實(shí)現(xiàn)對(duì)主設(shè)備優(yōu)先級(jí)的動(dòng)態(tài)調(diào)節(jié),以滿足主設(shè)備的實(shí)時(shí)性要求。該模塊從信號(hào)提取模塊中獲得各個(gè)主設(shè)備實(shí)時(shí)性相關(guān)的參數(shù)(主設(shè)備請(qǐng)求總線服務(wù)時(shí)間、最大截止時(shí)間、請(qǐng)求訪問(wèn)從設(shè)備的地址及從設(shè)備傳輸響應(yīng)時(shí)間等),然后進(jìn)行簡(jiǎn)單的處理后,傳入算法控制模塊,經(jīng)過(guò)算法控制模塊的運(yùn)算,最終得到各個(gè)主設(shè)備調(diào)整后的優(yōu)先級(jí)。優(yōu)先級(jí)調(diào)節(jié)器根據(jù)該結(jié)果通過(guò)信號(hào)授權(quán)模塊動(dòng)態(tài)調(diào)整各個(gè)主設(shè)備的優(yōu)先級(jí)。
(2)帶寬調(diào)節(jié)器
該模塊的主要作用是監(jiān)視總線上主設(shè)備實(shí)際傳輸帶寬和由算法控制的應(yīng)該配置帶寬之間的變化,實(shí)時(shí)反饋信息給算法控制模塊來(lái)保證帶寬精確分配。該模塊從信號(hào)提取模塊中獲得各個(gè)主設(shè)備帶寬要求相關(guān)的參數(shù)(主設(shè)備每次數(shù)據(jù)傳輸?shù)拈L(zhǎng)度、主設(shè)備帶寬需求以及總線帶寬利用情況等),然后進(jìn)行簡(jiǎn)單的處理,傳入算法控制模塊,經(jīng)過(guò)算法控制模塊的運(yùn)算,最終得到各個(gè)主設(shè)備調(diào)整后的帶寬要求,帶寬調(diào)節(jié)器根據(jù)該結(jié)果通過(guò)信號(hào)授權(quán)模塊動(dòng)態(tài)調(diào)整各個(gè)主設(shè)備的帶寬配置。
(3)總線傳輸控制器
該模塊的主要作用是監(jiān)視總線帶寬的狀態(tài),準(zhǔn)確預(yù)測(cè)出各設(shè)備請(qǐng)求的響應(yīng)時(shí)間,并將該結(jié)果傳入算法控制模塊,經(jīng)過(guò)算法控制模塊的運(yùn)算,得到新的總線帶寬分配方案??偩€傳輸控制器通過(guò)信號(hào)授權(quán)模塊來(lái)協(xié)調(diào)各個(gè)主設(shè)備使用總線。
(4)算法控制模塊
算法控制模塊的硬件邏輯包括:時(shí)間片定時(shí)器、判據(jù)寄存器組、比較邏輯和算法控制狀態(tài)機(jī)。其中,判據(jù)寄存器組的初始值通過(guò)離線計(jì)算獲得,在總線服務(wù)過(guò)程時(shí),通過(guò)主設(shè)備特性參數(shù)提取模塊獲得實(shí)時(shí)參數(shù)值,作為新的判據(jù)寄存器數(shù)據(jù)提供給算法控制狀態(tài)機(jī)。比較邏輯負(fù)責(zé)對(duì)算法運(yùn)行產(chǎn)生的新結(jié)果與判據(jù)寄存器組進(jìn)行比較,并對(duì)判據(jù)寄存器組內(nèi)的數(shù)據(jù)進(jìn)行更新。
算法控制狀態(tài)機(jī)采用Mealy有限狀態(tài)機(jī)來(lái)實(shí)現(xiàn)總線仲裁算法流程,完成對(duì)各主設(shè)備的優(yōu)先級(jí)、帶寬分配等屬性的動(dòng)態(tài)調(diào)節(jié)。另外對(duì)各主設(shè)備請(qǐng)求使用總線服務(wù)進(jìn)行仲裁,實(shí)現(xiàn)各主設(shè)備協(xié)調(diào)使用總線所提供的服務(wù)。
2 實(shí)驗(yàn)及結(jié)果分析
為驗(yàn)證基于閾值的最小空閑時(shí)間優(yōu)先服務(wù)總線仲裁器的性能,本文對(duì)基于動(dòng)態(tài)優(yōu)先級(jí)的仲裁器、基于時(shí)間輪轉(zhuǎn)的仲裁器和本文提出的仲裁器進(jìn)行了實(shí)驗(yàn),并進(jìn)行了比較。
2.1 實(shí)驗(yàn)平臺(tái)
實(shí)驗(yàn)硬件平臺(tái)為Core 2 Duo CPU(主頻為2 GHz),內(nèi)存4 GB,操作系統(tǒng)是Windows XP,仿真軟件使用ModelSim6.4。在實(shí)驗(yàn)平臺(tái)上,共實(shí)現(xiàn)了6個(gè)主設(shè)備、1個(gè)從設(shè)備和1個(gè)總線仲裁器。6個(gè)主設(shè)備的類型和相關(guān)參數(shù)如表1所示(在表1中,R表示有實(shí)時(shí)性要求,NR表示沒(méi)有實(shí)時(shí)性要求;B表示有帶寬要求,NB表示沒(méi)有帶寬要求)。
2.2 實(shí)驗(yàn)結(jié)果
首先,定義兩種性能指標(biāo):
(1)服務(wù)請(qǐng)求截止期錯(cuò)失率MDP(Missed Deadline Percentage)=“所有截止期錯(cuò)失的總線服務(wù)請(qǐng)求/所有主設(shè)備總線服務(wù)請(qǐng)求之和”。
(2)服務(wù)切換次數(shù)SSN(Service Switch Num)=“從未完成的總線服務(wù)請(qǐng)求到搶占的總線服務(wù)請(qǐng)求切換次數(shù)”+“從完成總線服務(wù)請(qǐng)求到另一總線服務(wù)請(qǐng)求的切換次數(shù)”。
在此基礎(chǔ)上,對(duì)表1中所示的6個(gè)主設(shè)備分別采用4種總線仲裁算法進(jìn)行仿真實(shí)驗(yàn),得到如下結(jié)果。
(1)對(duì)于不同總線負(fù)載ρ
取公式(2)中的α=5,圖2和圖3分別表示對(duì)于不同總線負(fù)載ρ(0.5≤ρ≤2.0)情況下,4種總線仲裁算法的MDP比較。其中圖2是在每個(gè)主設(shè)備請(qǐng)求100個(gè)總線服務(wù)下的MDP,圖3是每個(gè)主設(shè)備請(qǐng)求200個(gè)總線服務(wù)下的MDP。從圖2和圖3中可以看出,最小空閑時(shí)間優(yōu)先總線仲裁器得到的MDP要明顯小于其他兩種總線仲裁器。當(dāng)ρ≤1時(shí),最小空閑時(shí)間總線仲裁器可以保證每個(gè)主設(shè)備都滿足其總線服務(wù)截止期要求;當(dāng)ρ>1時(shí),會(huì)出現(xiàn)主設(shè)備部分總線服務(wù)請(qǐng)求不能滿足其服務(wù)截止期要求的情況,但其MDP要明顯小于其他兩種總線仲裁器。
(2)對(duì)于不同比例系數(shù)α
取ρ=1.3,圖4和圖5分別給出了在不同比例系數(shù)α時(shí)的MDP和SSN變化情況。
從圖4中可以看出,對(duì)于MDP的影響,并不是搶占次數(shù)越多(比例系數(shù)α越小)調(diào)度效果就越好,而是當(dāng)α=12時(shí),MDP最??;而當(dāng)α=1時(shí),MDP達(dá)到最大。從圖5中可以看出,SSN的值隨著ρ的變大而逐漸變小,但是,當(dāng)α的值大到一定量時(shí),SSN的值變化不明顯;當(dāng)α接近1時(shí),SSN變化顯著。究其原因,從公式(2)中可以看出:當(dāng)α=1時(shí),hi=pi,即主設(shè)備的搶占閾值等于其優(yōu)先級(jí),則搶占閾值就沒(méi)有起到作用,即變成了完全搶占模式,該情況下,主設(shè)備頻繁地?fù)屨伎偩€服務(wù),造成過(guò)多的總線服務(wù)切換,浪費(fèi)了總線帶寬資源,從而影響總線服務(wù)的性能;當(dāng)α=16時(shí)主設(shè)備的搶占閾值為最高優(yōu)先級(jí),造成永遠(yuǎn)不能被其他主設(shè)備搶占的情況,成為非搶占模式。以上兩種情況都會(huì)造成總線服務(wù)質(zhì)量的下降,所以,比例系數(shù)α的選擇應(yīng)當(dāng)保證MDP最小的情況下,相應(yīng)的SSN值不能太大,結(jié)合圖4和圖5可以看出,α=12為最優(yōu)比例系數(shù)。
2.3 試驗(yàn)結(jié)果分析
在PT-LSF算法中,總線仲裁器在收集主設(shè)備請(qǐng)求特性參數(shù)和總線傳輸狀態(tài)信息基礎(chǔ)上,結(jié)合主設(shè)備請(qǐng)求總線服務(wù)的緩急程度來(lái)實(shí)時(shí)地改變主設(shè)備優(yōu)先權(quán),以滿足主設(shè)備強(qiáng)實(shí)時(shí)性要求。通過(guò)與常用的動(dòng)態(tài)優(yōu)先級(jí)算法、時(shí)間片輪轉(zhuǎn)算法和Lottery算法的實(shí)驗(yàn)分析比較可以看出,本文提出的PT-LSF算法在服務(wù)請(qǐng)求截止期錯(cuò)失率(MDP)上有顯著優(yōu)勢(shì)。當(dāng)總線負(fù)載在0.5~1.0范圍內(nèi)時(shí),PT-LSF算法的MDP值為0;當(dāng)總線負(fù)載在1.0~2.0范圍內(nèi)時(shí),PT-LSF算法的MDP值比時(shí)間片輪轉(zhuǎn)算法平均減少了50.8%,比動(dòng)態(tài)優(yōu)先級(jí)算法平均減少了43.6%,比Lottery算法平均減少了36.3%。綜合對(duì)比,PT-LSF算法的MDP比其他算法平均減少了43.8%,能很好地滿足各主設(shè)備在各種情況下的強(qiáng)實(shí)時(shí)要求。另外,在PT-LSF算法中,使總線服務(wù)達(dá)到最優(yōu)時(shí),并不是搶占次數(shù)越多(比例系數(shù)α越大)越好,而是取一個(gè)中間合適值。在本文中,系統(tǒng)最大優(yōu)先級(jí)為16,最小優(yōu)先級(jí)為1,最優(yōu)比例系數(shù)α為12,該結(jié)果為搶占閾值比例系數(shù)?琢的確定提供了實(shí)驗(yàn)依據(jù)。
本文提出了基于最小空閑時(shí)間優(yōu)先的總線仲裁算法,并給出了算法的實(shí)現(xiàn)流程和組成結(jié)構(gòu)。將其與動(dòng)態(tài)優(yōu)先級(jí)算法、時(shí)間片輪轉(zhuǎn)算法和Lottery算法進(jìn)行比較。實(shí)驗(yàn)結(jié)果顯示:該總線仲裁算法在MDP方面比其他兩種算法平均減少了43.8%,能更好地保證主設(shè)備的強(qiáng)實(shí)時(shí)要求。該總線仲裁算法對(duì)于共享總線的片上系統(tǒng)設(shè)計(jì)具有重要的參考價(jià)值。
參考文獻(xiàn)
[1] POLETTI F,BERTOZZI D,BENINI L,et al.Performance analysis of arbitration policies for SoC communication architectures[J].Journal of Design Automation for Embedded Systems,2003(8):189-210.
[2] LISNER J C.Efficiency of dynamic arbitration in TDMA protocols[C].EDCC2005,Berlin,2005:91-102.
[3] ZHANG Y.Architecture and performance comparison of a statistic-based Lottery arbiter for shared bus on chip[C]. //Proceedings of Asia South Pacific Design Automation Conference,Yokohama,2004:1313-1316
[4] Bu-Ching Lin,Geeng-Wei Lee,Juinn-Dar Huang,et al.A Precise bandwidth control arbitration algorithm for hard real-time SoC buses.IEEE,2007:165-170.
[5] 徐懿,李麗,杜高明,等.一款基于多處理器片上系統(tǒng)的動(dòng)態(tài)自適應(yīng)仲裁器[J].計(jì)算機(jī)研究與發(fā)展,2008,45(6):1085-1092.
[6] 孟海波,張志敏.基于傳輸時(shí)間精確預(yù)測(cè)的片上總線仲裁算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2008,20(7):830-837.