周佳兵,潘澤躍,曹 飛
?。ㄖ袊茖W(xué)技術(shù)大學(xué) 自動化系,安徽 合肥 230027)
摘 要: 介紹了TI DSP算法標(biāo)準(zhǔn)XDAIS(TMS320 algorithm standard)和算法參考框架RF5(Reference Framework 5),分析了XDAIS算法接口的實(shí)現(xiàn)和RF5框架中數(shù)據(jù)元素的操作流程。通過建立標(biāo)準(zhǔn)算法庫,并在實(shí)例工程中基于RF5框架實(shí)現(xiàn)標(biāo)準(zhǔn)算法的封裝與調(diào)用,較大地提高了算法性能。
關(guān)鍵詞: 算法參考框架;算法接口標(biāo)準(zhǔn);算法封裝
0 引言
TI公司提出了eXpressDsp軟件技術(shù),在軟件開發(fā)層面上推出了BIOS+RF5+算法標(biāo)準(zhǔn)XDAIS架構(gòu)。XDAIS規(guī)范了DSP算法軟件的開發(fā),提供了類似面向?qū)ο缶幊讨械念惖姆庋b方式的算法接口,使得算法集成變得簡單統(tǒng)一。RF5作為DSP軟件開發(fā)的起步代碼參考框架,以DSP/BIOS為基礎(chǔ),利用其中的數(shù)據(jù)處理元素和數(shù)據(jù)通信元素可以方便地完成復(fù)雜算法應(yīng)用程序的設(shè)計(jì)與開發(fā)。但在實(shí)際工作中,XDAIS算法、RF5框架的使用卻顯得相對較少,導(dǎo)致實(shí)際開發(fā)的程序過于臃腫,代碼移植性較差,這主要因?yàn)閄DAIS算法接口的調(diào)用、RF5框架的層次化封裝相對復(fù)雜。如何規(guī)范使用XDAIS與RF5,使得音視頻、網(wǎng)絡(luò)通信等包含大量算法、多線程通道的復(fù)雜應(yīng)用程序的開發(fā)更為簡便已成為廣大DSP開發(fā)者的迫切需求。
1 RF5框架
RF5主要實(shí)現(xiàn)了存儲管理、線程模型和通道封裝三個功能。RF5基本框架結(jié)構(gòu)如圖1[1]所示。RF5框架通過驅(qū)動開發(fā)套件(DDK)[2]完成應(yīng)用層與底層硬件的交互;以DSP/BOIOS為基礎(chǔ),通過對XDAIS算法的封裝完成應(yīng)用程序的開發(fā)。芯片支持庫(CSL)[3]作為驅(qū)動模塊與底層硬件的橋梁為各種外設(shè)提供標(biāo)準(zhǔn)庫函數(shù)調(diào)用。
RF5框架包含4個基本數(shù)據(jù)處理元素:線程(TASK)、通道(CHANNEL)、核(CELL)、XDAIS算法。它們處于依次包含的關(guān)系。每一個線程可以包含多個通道,并順序執(zhí)行所包含的通道,用以完成特定的操作;通道是核的集合,核在通道內(nèi)也被順序執(zhí)行;核內(nèi)封裝了XDAIS算法,一個核便是包含一種XDAIS算法的容器,并提供了供外部調(diào)用的核對象接口(ICELL)以及核通信管理模塊ICC對象。
2 XDAIS算法庫封裝
2.1 抽象算法接口與實(shí)例算法接口
XDAIS是為了提高DSP軟件開發(fā)效率而提出的一套通用算法接口標(biāo)準(zhǔn)。XDAIS算法可以重復(fù)利用且以庫的形式在程序中被調(diào)用。為統(tǒng)一算法開發(fā)規(guī)范,該標(biāo)準(zhǔn)提供一系列規(guī)則[4],如XDAIS算法不允許直接訪問硬件外設(shè),必須通過標(biāo)準(zhǔn)的資源管理接口(IALG)來實(shí)現(xiàn)。
IALG抽象接口IALG_Fxns[5],也叫算法成員對象列表或V-表,主要實(shí)現(xiàn)存儲管理、創(chuàng)建和銷毀算法實(shí)例對象。其內(nèi)部有3個重要結(jié)構(gòu)字段:algAlloc()、algFree()和algInit()。algAlloc()和algFree()表示內(nèi)存的分配和釋放,algInit()用來初始化算法參數(shù)并使內(nèi)存指向算法的處理空間。三個字段都不能為NULL。
在具體應(yīng)用時(shí),需要另外創(chuàng)建算法實(shí)例接口IXX_Fxns(XX表示要實(shí)現(xiàn)的具體算法名),該接口包含了算法的具體實(shí)現(xiàn)函數(shù)聲明。以JPEG解碼算法為例,定義的算法實(shí)例接口代碼如下:
typedef struct IJPEGDEC_Fxns{
IALG_Fxns ialg;
XDAIS_Int32(*decode)(IJPEGDEC_Handle
handle,XDAS_Int8**in,XDAS_Int8*out);
}IJPEGDEC_Fxns;
IJPEGDEC_Fxns是IALG_Fxns的擴(kuò)展。IJPEGDEC_Fxns中聲明了具體解碼實(shí)現(xiàn)函數(shù)decode()。在應(yīng)用程序中調(diào)用decode()函數(shù),需要將整個XDAIS算法封裝成庫,在應(yīng)用程序所在的工程中加載該庫,并調(diào)用該庫提供的接口decode()函數(shù)實(shí)現(xiàn)解碼運(yùn)算。
2.2 算法庫封裝實(shí)現(xiàn)
XDAIS的特點(diǎn)是,主要內(nèi)存的分配和銷毀不再由具體的算法負(fù)責(zé),而是據(jù)據(jù)XDAIS算法內(nèi)存使用規(guī)則及內(nèi)存分配字段函數(shù)alg_alloc()予以分配。抽象算法接口函數(shù)調(diào)用流程如圖2所示。
實(shí)際算法框架搭建步驟是:首先啟動XDAIS算法組件向?qū)Вx算法接口標(biāo)示,如JPEGDEC_TI_IJPEGDEC,JPEGDEC表示算法功能為JPEG解碼,TI表示算法持有人。在向?qū)е卸x輸入輸出參數(shù)結(jié)構(gòu)體,聲明內(nèi)存表結(jié)構(gòu)、核心處理函數(shù)XX()等內(nèi)容,生成算法接口文件。其次專門建立庫工程(.lib文件),包含上一步生成的工程目錄下的算法接口文件,并分配內(nèi)存表,修改輸入輸出參數(shù),并實(shí)現(xiàn)算法處理函數(shù)XX()。最后釋放內(nèi)存并修改編譯選項(xiàng),編譯完成后生成符合XDAIS的標(biāo)準(zhǔn)接口算法庫(.lib文件)。
3 RF5框架使用
XDAIS算法封裝成庫之后,就需要考慮如何去調(diào)用它。開辟新的工程,在命令鏈接文件中實(shí)現(xiàn)算法庫的代碼如下:
_JPEGDEC_IJPEGDEC=
_JPEGDEC_TI_IJPEGDEC-l.\lib\jpeg_ti.lib
通過第一句賦值,在新工程中引用_JPEGDEC_IJPEGDEC即可調(diào)用XDAIS實(shí)例算法接口,jpeg_ti.lib是成功封裝的XDAIS標(biāo)準(zhǔn)算法庫,第二句成功將jpeg算法庫鏈接到工程文件中去。
根據(jù)RF5的數(shù)據(jù)元素特性,需要算法、核、通道、線程一步步地按層次封裝。首先第一步需要將XDAIS算法封裝在CELL中,只需要將算法庫的實(shí)例算法接口在應(yīng)用程序所在工程中進(jìn)行調(diào)用即可。在這之前,需要在頭文件中聲明CELL對象ICELL_Obj和CELL接口ICELL_Fxns等,ICELL_Obj封裝了實(shí)例算法接口、CELL接口ICELL_Fxns和ICC句柄,通過ICELL_Fxns定義的操作函數(shù)cellExcute()來管理并執(zhí)行CELL中封裝的算法處理函數(shù),通過ICC句柄實(shí)現(xiàn)CELL與通道對象間通信。
以JPEG解碼算法為例,算法處理線程源文件中ICELL_Obj的定義如下:
typedef struct ICELL_Obj{
cell=&thrProcess.cellListDecode[];//創(chuàng)建cell對象
cell->cellFxns=
&JPEGDEC_CELLFXNS;//定義CELL接口
cell->algFxns=
?。↖ALG_Fxns*)&JPEGDEC_IJPEGDEC;
//實(shí)例算法接口封裝
inputIcc=(ICC_Handle)ICC_linearCreate(NULL,0);
//創(chuàng)建輸入ICC對象
outputIcc=(ICC_Handle)ICC_linearCreate(NULL,0);
//創(chuàng)建輸出ICC對象
CHAN_regCell(cell,&inputIcc,1,&outputIcc,1);
//將cell注冊到通道中
}
通過BIOS配置算法處理線程[6],在算法處理線程中定義CELL對象ICELL_Obj、ICC句柄ICC_Handle和算法處理參數(shù),在main函數(shù)里初始化通道模塊,這是因?yàn)楸仨毻ㄟ^通道channel去操作。在線程初始化函數(shù)中進(jìn)行通道內(nèi)cell的注冊CHAN_regCell(),然后通過CHAN_open()函數(shù)打開通道,最后在線程處理函數(shù)中調(diào)用CHAN_execute()完成CELL接口調(diào)用,執(zhí)行CELL接口調(diào)用函數(shù)cellExcute(),最終調(diào)用封裝在CELL內(nèi)的算法處理函數(shù)XX()。如圖3所示。
4 封裝實(shí)例
結(jié)合H.264編碼算法封裝實(shí)例,通過軟件開發(fā)平臺CCS3.3實(shí)際測試算法性能。創(chuàng)建了兩個例程,分別是采用XDAIS標(biāo)準(zhǔn)和RF5封裝的算法程序,和以源文件形式存在未經(jīng)封裝的算法程序。在BIOS靜態(tài)面板中配置內(nèi)存空間并配置輸入輸出線程,輸入線程采集圖像數(shù)據(jù),而輸出線程在兩個實(shí)例中則作用不同。
首先,未經(jīng)封裝的編碼算法所涉及的幀間預(yù)測、運(yùn)動估計(jì)、量化等一系列算法子函數(shù)均以源文件存在于工程中并在tskVideoOutput線程中調(diào)用,如圖4所示。
將這些程序文件按照XDAIS算法標(biāo)準(zhǔn)封裝于庫H.264_enclib.lib中,然后按照RF5框架數(shù)據(jù)元素的封裝步驟,在tskProcess線程中調(diào)用此庫和算法處理函數(shù)接口,得到工程如圖5所示。
其次通過在程序中添加UTL統(tǒng)計(jì)函數(shù)來分別分析和比較采用兩種方法的算法執(zhí)行情況。圖6所示為未封裝情況,在tskOutput線程中設(shè)置STS時(shí)間統(tǒng)計(jì)模塊stsExeTimeEnc得到編碼算法程序執(zhí)行的平均指令周期為11.599 ms。圖7為經(jīng)RF5框架封裝后的算法執(zhí)行情況,在tskVideoProcess線程中設(shè)置STS時(shí)間統(tǒng)計(jì)模塊stsExeTimeh264Enc得到平均指令周期為4.083 ms。
從CPU占用情況來看,未經(jīng)封裝的算法程序CPU占用率較高,平均占有率在50%左右,而經(jīng)過RF5封裝調(diào)用的算法程序?qū)嶋H平均CPU占用率在31%左右,分別如圖8和圖9所示。
5 結(jié)束語
以上分析了整個XDAIS算法封裝和調(diào)用的具體過程。通過eXpressDSP提供的XDAIS算法組件向?qū)蓸?biāo)準(zhǔn)算法框架,然后編寫符合XDAIS標(biāo)準(zhǔn)的具體應(yīng)用算法。通過此框架生成lib庫文件并提供接口給需要調(diào)用它的工程,在調(diào)用工程中通過線程、通道、核對象等接口一步步地對該算法予以封裝,最終建立起含有復(fù)雜算法的RF5框架工程??蚣艿慕⒑退惴ǖ姆庋b過程也證明了RF5強(qiáng)大的擴(kuò)展性和適用性,設(shè)計(jì)人員不用考慮底層就能開發(fā)出多通道復(fù)雜算法的應(yīng)用程序。通過對算法函數(shù)、核及通道對象的修改就可輕松移植適合特定工程的算法,在實(shí)際工程應(yīng)用中具有很大的實(shí)用性。
參考文獻(xiàn)
[1] Texas Instruments Incorporated. Reference frameworks for eXpressDSP software: RF5, an extensive, high-density system[R]. Texas Instruments, 2003.
[2] DSP/BIOS driver developer′s guide[R]. Texas Instruments,2005.
[3] TMS320C6000 CSL API reference guide[R]. Texas Instruments, 2004.
[4] Texas Instruments Incorporated.TMS320 DSP算法標(biāo)準(zhǔn)[M].徐盛,胡劍凌,譯.北京:清華大學(xué)出版社,2007.
[5] TMS320 DSP algorithm standard API reference[R]. Texas Instruments, 2005.
[6] DSP/BIOS user′s guide[R]. Texas Instruments, 2002.