《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 兩款主流定點(diǎn)DSP芯片的性能比較

兩款主流定點(diǎn)DSP芯片的性能比較

2008-12-18
作者:劉長軍 顧夏華 林嘉宇

  摘? 要: TI(Texas Instruments)公司的TMS320C54X系列和ADI(Analog Devices Inc.)公司的ADSP-218X系列是目前應(yīng)用廣泛的兩款主流16位定點(diǎn)DSP芯片。以Geffe發(fā)生器和MD5算法的實現(xiàn)為例,通過對這兩款芯片性能的詳細(xì)比較,分析研究了它們各自的優(yōu)缺點(diǎn)。?

  關(guān)鍵詞: DSP芯片? TMS320C54X? ADSP-218X? 性能比較

?

  從1982年第一片數(shù)字信號處理器(Digital Signal Processor,DSP)TMS320C10產(chǎn)生以來,經(jīng)過二十年的發(fā)展,DSP以其卓越的性能、獨(dú)有的特點(diǎn),已成為通信、計算機(jī)、消費(fèi)類電子產(chǎn)品等領(lǐng)域的基礎(chǔ)器件。業(yè)內(nèi)人士預(yù)言,DSP將是未來集成電路中發(fā)展最快的電子產(chǎn)品,并成為電子產(chǎn)品更新?lián)Q代的決定因素,它將徹底變革人們的工作、學(xué)習(xí)和生活方式。?

  DSP[6][8][9]具有兩種算術(shù)結(jié)構(gòu):定點(diǎn)和浮點(diǎn)。從理論上講,雖然浮點(diǎn)DSP的動態(tài)范圍比定點(diǎn)DSP大,且更適合于DSP的應(yīng)用場合,但定點(diǎn)運(yùn)算的DSP器件的成本較低,對存儲器的要求也較低,而且耗電較省。定點(diǎn)運(yùn)算的可編程DSP器件仍是市場上的主流產(chǎn)品。據(jù)統(tǒng)計,目前銷售的DSP器件中的80%以上屬于16位定點(diǎn)可編程DSP器件。其中,TI公司的TMS320C54X系列和ADI公司的ADSP-218X系列是目前廣泛使用的主流定點(diǎn)DSP芯片。下面就以它們?yōu)檠芯繉ο?結(jié)合Geffe發(fā)生器[7]和MD5算法的實現(xiàn),對其性能進(jìn)行分析比較。由于TI的TMS320VC5402和ADI的ADSP-2186N是使用較多的兩款,硬件性能指標(biāo)又相近,有很好的可比性,所以編程實現(xiàn)時就選擇它們?yōu)榫唧w芯片。雖然兩款DSP芯片都提供C編譯器,但是因為效率都不高,這里我們就不作討論。下面的論述都是基于直接用匯編語言" title="匯編語言">匯編語言編程的。?

1 Geffe發(fā)生器與MD5算法?

  先簡單介紹一下兩個算法。Geffe發(fā)生器是一種密鑰序列發(fā)生器,它利用線性反饋移位寄存器(Linear Feedback Shift Register,LFSR)產(chǎn)生序列密碼。Geffe發(fā)生器使用了三個LFSR,它們以非線性方式組合,其中兩個LFSR作為復(fù)合器的輸入,第三個LFSR控制復(fù)合器的輸出。因為運(yùn)算量很大,所以LFSR用軟件實現(xiàn)起來比較慢,但是用匯編語言實現(xiàn)比用C語言實現(xiàn)快。?

  MD5(MD,即Message Digest)是一個單向散列函數(shù),它對輸入消息產(chǎn)生128位散列值(或消息摘要)。該算法需要進(jìn)行大量的移位和邏輯操作,用DSP實現(xiàn)比較方便。?

2 TMS320C54X系列與ADSP-218X系列性能比較" title="性能比較">性能比較?

2.1 硬件結(jié)構(gòu)[1][4][5]?

  TMS320C54X系列采用改進(jìn)的Harvard結(jié)構(gòu)體系,有一組程序總線和三組數(shù)據(jù)總線、高度并行性的算術(shù)邏輯單元ALU、乘法/累加器MAC、桶形移位器、緩沖串口、專用硬件邏輯、片內(nèi)存儲器、片內(nèi)外設(shè)和高度專業(yè)化的指令集等等。支持32位長操作數(shù)指令,支持并行存儲和并行裝入的算術(shù)指令。?

  ADSP-218X系列借鑒了TMS320X系列的優(yōu)缺點(diǎn),重新設(shè)計。它也是采用改進(jìn)的Harvard結(jié)構(gòu)體系。ALU、MAC、桶形移位器這三個獨(dú)立的運(yùn)算部件均可以單周期操作。還有豐富的雙緩沖串口、中斷(分外中斷和內(nèi)中斷)等。在TMS320C54X系列中,程序存儲區(qū)和數(shù)據(jù)存儲區(qū)是混在一起的,而ADSP-218X系列從物理上就將兩者分開,這就使多功能指令操作顯得非常方便。因此,ADSP-218X系列程序?qū)崿F(xiàn)更有高效性。?

  兩款芯片主要技術(shù)指標(biāo)的比較如表1所示。?

?

?

  可見,兩款系列芯片性能指標(biāo)的選擇范圍都很大,而TMS320C54X系列的選擇空間更大一些。具體到本文選用的TMS320VC5402和ADSP-2186N,主要參數(shù)(MIPS/Cycle Time/RAM)為:TMS320VC5402是100/10ns/16kword,ADSP-2186N是80/12.5ns/16Kword。這兩種芯片的硬件性能指標(biāo)相仿,用它們實現(xiàn)相同的算法,具有很好的可比性。?

2.2 程序編程[2][3][4][6]?

  下面分別用TMS320VC5402和ADSP-2186N實現(xiàn)Geffe發(fā)生器和MD5算法,以此來比較兩款芯片在編程過程中的優(yōu)劣。其中,Geffe發(fā)生器產(chǎn)生96字的序列,MD5處理的消息長63個字。?

2.2.1 指令系統(tǒng)" title="指令系統(tǒng)">指令系統(tǒng)概述?

  ADSP-2186N指令系統(tǒng)使用代數(shù)符號來表示算術(shù)運(yùn)算和數(shù)據(jù)傳送,源代碼具有較高的可讀性,且不會損壞運(yùn)行特性。它的指令系統(tǒng)很精簡,程序員可以快速掌握。ADSP-2186N的編程方式" title="編程方式">編程方式和高級語言類似,如果用戶有高級語言編程的經(jīng)驗,上手較快。?

  TMS320VC5402指令系統(tǒng)很豐富,靈活多變,雖然使用時很方便,但是完全掌握卻有一定的困難,這對程序員來說是個不小的難題。它的指令系統(tǒng)有傳統(tǒng)的助記符和代數(shù)符號兩種方式,程序員可以根據(jù)所好任選一種。助記符方式對于習(xí)慣了匯編語言的開發(fā)者易于接受,代數(shù)符號方式則表達(dá)簡潔、較為直觀、易于理解。但是,合作完成項目時,往往會由于不同的程序員選擇不同的格式而造成麻煩。解決的方法有兩個,一是使用TI提供的轉(zhuǎn)換工具,另一是只將兩者的obj文件鏈接調(diào)試,但調(diào)試時有些不方便。?

  另外,兩者的編譯環(huán)境也有差別。相比較而言,ADSP-2186N的界面要友好一些,它和VC++非常相像,很方便。?

2.2.2 指令的“單周期性”?

  ADSP-2186N的每條程序語言都匯編成僅需一個執(zhí)行周期的24位指令機(jī)器碼。它完全在并行處理方式下工作,所有的指令都是真正的單周期指令。除了訪問慢速的外部存儲設(shè)備,或者外部存儲器出現(xiàn)控制權(quán)競爭而需要附加周期的情況外,任何指令的運(yùn)行一般僅需一個周期。由于它的指令系統(tǒng)沒什么“禁忌”,所以程序員大可像編寫高級語言程序一樣,只需要考慮算法如何實現(xiàn),至于編程過程就可以不太注意。?

  可是,TMS320VC5402的指令系統(tǒng)卻不是這樣。TMS320VC5402的各個單元是基于流水線方式的結(jié)構(gòu),指令按流水線方式工作。它的大多數(shù)指令在單獨(dú)執(zhí)行時并不能在一個周期內(nèi)完成,只是在流水線方式下工作或重復(fù)操作時,才可以做到平均每一個周期執(zhí)行一條指令。因此,在它的指令系統(tǒng)中,不僅有不少的指令需要多個執(zhí)行周期,而且由于“時延”的原因,如果處理的不好,還會出現(xiàn)額外的附加周期。因此為了保證每條指令準(zhǔn)確執(zhí)行,有時就不得不把程序打亂,就是說,相關(guān)聯(lián)的幾條語句要分散插入別的地方。程序的模塊化遭到損害,顯得雜亂無章,大大影響了可讀性。?

  如下面語句中的句1、句2、句3、句4(選自Geffe發(fā)生器)是我們實際應(yīng)用的形式(指令用代數(shù)符號格式,下面如果不特別指出,均為這樣)。?

??? m_seq_l1:?????????????????? ;標(biāo)號?

??????????? ……? ?

??????????? b=a & #1????????? ? ??;句1?

??????????? if(aeq)goto m_seq_l2?? ;句2,if a=0, goto m_seq_l2?

??????????? a=a>>1????????????? ;句3?

??????????? if(beq)goto m_seq_l1?? ;句4,if b=0, goto m_seq_l1?

??????????? ……?

??? m_seq_l2:?

??????????? ……?

??? 但是,它們正常語序則應(yīng)該為?

??? m_seq_l1:?????????????????? ??? ;標(biāo)號?

??????? ……? ?

??????? a=a>>1????????????? ??? ;句3(若這樣,a的初始值隨之改變)?

??????? if(aeq)goto m_seq_l2??? ;句2,if a=0,goto m_seq_l2?

??????? b=a & #1??????? ??? ??? ;句1?

??????? if(beq)goto m_seq_l1?? ;句4,if b=0,goto m_seq_l1?

??????? ……?

??? m_seq_l2:?

??????? ……?

  不過,若以正常語序執(zhí)行if語句時,a、b的值會因為時延不夠,來不及改變而導(dǎo)致程序出錯。為避免這種情況,要么在句3和句2以及句1和句4之間分別加上若干個空操作(nop),這樣就會影響速度;要么調(diào)整它們的順序,如實際應(yīng)用中的句1、句2、句3、句4。有時候,語句順序?qū)嵲跓o法調(diào)整,就不得不加上一些空操作。尤其是循環(huán)的主體部分,往往一條語句處理的不好,就會導(dǎo)致整個程序多運(yùn)行成千上萬條指令。因此,TMS320C54系列編程對程序員的要求較高,必須非常熟悉指令系統(tǒng),才可以得到高效的程序。?

2.2.3 對數(shù)組的循環(huán)操作?

  關(guān)于對數(shù)組進(jìn)行循環(huán)操作,兩者平分秋色。它們都支持寄存器地址自動加減。只不過ADSP-2186N的調(diào)試界面看上去更直觀些。?

2.2.4 對32位長操作數(shù)操作?

  ADSP-2186N不支持32位操作,如果需要的話,必須多條指令共同完成。而TMS320VC5402經(jīng)過簡單的設(shè)置,就可以直接進(jìn)行一些32位操作。?

  例如,MD5算法中4輪主循環(huán)都需要大量的32位邏輯運(yùn)算及加法操作。?

  表2示出“與”運(yùn)算和加法的實例,顯然,用TMS320VC-5402實現(xiàn)要方便簡潔的多。用ADSP-2186N實現(xiàn)時,必須將32位分為高16位和低16位分別操作,最后再整合。這也是為什么在實現(xiàn)MD5算法時,用ADSP-2186N實現(xiàn)不如TMS320VC5402有效的主要原因。?

?

?

  另外,兩者在編程時還有一些不同,例如,TMS320VC5402有標(biāo)號必須頂格寫等要求??偟膩碚f,TMS320VC5402指令系統(tǒng)中有不少的“禁忌”,需要經(jīng)驗積累才可以發(fā)現(xiàn),這就給編程者帶來了不便。兩款DSP芯片實現(xiàn)Geffe發(fā)生器和MD5算法的具體結(jié)果如表3所示。?

?

?

  可以看出,實現(xiàn)Geffe發(fā)生器時,ADSP-2186N較快,主要是因為其指令系統(tǒng)的單周期性;實現(xiàn)MD5算法時,TMS320VC5402稍快,主要原因是它支持32位操作。?

2.3 其它?

  總而言之,從技術(shù)上看,ADSP-218X系列稍占優(yōu)勢。但目前的實際情況是:1999年TI占有全球DSP市場48%的份額,市場排名第一。2000年其市場占有率也是第二名的兩倍多。尤其在中國,市場占有率在80%左右。主要原因如下:?

  第一是價格。性能相近的芯片,TI比ADI要便宜很多。如TMS320VC5402的單片價格為$5.66,ADSP-2186N的單片價格則為$8.50。從性價比看,TI占優(yōu)勢。從產(chǎn)品效益看,如果大批量生產(chǎn),顯然TI的芯片實惠。?

  第二是服務(wù)。這里指的是指生產(chǎn)商提供的服務(wù)。TI公司有非常完善的服務(wù)體系,從產(chǎn)品宣傳到課程培訓(xùn),非常齊全。ADI公司這方面略有不足。?

  第三是第三方" title="第三方">第三方服務(wù)。市場上支持TI芯片的第三方服務(wù)要比支持ADI的多,這也是由于TI芯片的市場占有率高的緣故。反過來,大量支持TI芯片的第三方服務(wù),又保證了TI芯片的市場占有率。兩者是相輔相成的關(guān)系。?

  第四是繼承性。DSP芯片有其特殊性,不同公司的芯片,其編程方式差異很大。因此,程序員一旦熟悉了一種芯片,就不愿意更換。在我國,TI公司的用戶要遠(yuǎn)遠(yuǎn)多于ADI公司的用戶。為便于交流和學(xué)習(xí),新的用戶也會傾向于選擇TI公司的芯片。?

  第五是性能。雖然從技術(shù)性能看,TI的芯片稍稍遜色一些,但只要程序員付出一定精力,也可以得到高效的程序。?

  所以,TMS320C54X系列和ADSP-218X系列可以說是各有千秋,互有短長。ADSP-218X系列界面友好、指令簡潔、方便新手學(xué)習(xí),因此適于教學(xué)應(yīng)用。而TMS320C54X系列性價比高、服務(wù)體系完善、產(chǎn)品效益好,故公司企業(yè)多選用它。?

參考文獻(xiàn)?

1 TMS320C54x DSP CPU and Peripherals Reference Set,Volume 1. Texas Instruments,2001?

2 TMS320C54x DSP Set Volume 3:Algebraic Instruction.Texas Instruments,2001?

3 TMS320C54x Assembly Language Tools User’s Guide. Texas Instruments, 2001?

4 ADSP-218x DSP Hardware Reference. Analog Devices,2001?

5 DSP Selection Guide 2001 Edition. Analog Devices,2001?

6 蘇 濤. 高性能數(shù)字信號處理器與高速實時信號處理.西安:西安電子科技大學(xué)出版社,2000?

7 (美)Bruce Schneier著,吳世忠,祝世雄,張文政等譯.應(yīng)用密碼學(xué)——協(xié)議、算法與C源程序.北京:機(jī)械工業(yè)出版社,2001?

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。