《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 高端訪談 > TI低功耗多核DSP引領(lǐng)高性能計(jì)算新時(shí)代

TI低功耗多核DSP引領(lǐng)高性能計(jì)算新時(shí)代

2011-11-30
作者:電子技術(shù)應(yīng)用網(wǎng)記者:陳穎瑩

    DSP產(chǎn)生的初衷是為了增強(qiáng)系統(tǒng)計(jì)算功能,經(jīng)過近三十年的發(fā)展,DSP已經(jīng)從單純數(shù)字信號(hào)處理器發(fā)展為片上系統(tǒng)(SoC)。德州儀器(TI)不斷增加DSP的處理能力,其DSP的處理速度已飛速發(fā)展到了10 GHz,并且在內(nèi)部集成了ARM內(nèi)核。然而,在綠色環(huán)保被高度關(guān)注的今天,低功耗也是DSP發(fā)展的主題之一,而不是一味的追求高性能。TI在2011年超級(jí)計(jì)算大會(huì)(SC´11)上演示了其針對超低功耗、超高性能計(jì)算應(yīng)用的TMS320C66x系列最新產(chǎn)品TMS320C6678多核DSP,它是業(yè)界性能最高、功耗最低的DSP,這預(yù)示著全新高性能計(jì)算(HPC)時(shí)代的到來。TI中國區(qū)通用DSP業(yè)務(wù)發(fā)展經(jīng)理鄭小龍先生向記者介紹了相關(guān)情況。

為低功耗HPC樹立榜樣

    說它功耗低,到底低到什么程度呢?圖1是一個(gè)C6678和知名電信計(jì)算刀片及多核處理器平臺(tái)制造商研華(Advantech)開發(fā)的采用了4個(gè)C6678的半長PCIe卡DSPC-8681多媒體處理引擎的性能表。可以看到,C6678只需要消耗1 W就可以運(yùn)算6 FFT GFLOP或者5.4 SGEMM GFLOP;DSPC-8681消耗1 W則可運(yùn)算3.85 FFT GFLOP或者3.5 SGEMM GFLOP。也就是說,C6678 用10 W功耗就可實(shí)現(xiàn)160 GFLOP的性能,半長PCIe卡在50 W極低功耗下能實(shí)現(xiàn)超過500 GFLOP的性能。小龍介紹到:“TI和研華還將很快推出在200 W極低功耗下支持1~2萬億次浮點(diǎn)運(yùn)算性能的全長卡,為HPC應(yīng)用帶來更高效率更快速度的解決方案,實(shí)現(xiàn)業(yè)界轉(zhuǎn)型。”此外,TI低功耗SmartReflex技術(shù)也使設(shè)計(jì)更加綠色環(huán)保。

    據(jù)了解,研華發(fā)布DSPC-8681以來,該產(chǎn)品已經(jīng)在高強(qiáng)度計(jì)算雷達(dá)與醫(yī)療影像應(yīng)用中得到早期市場采用。TI最新系列多核開發(fā)工具的推出不但將顯著加速HPC應(yīng)用客戶的評估,而且還將在超級(jí)計(jì)算領(lǐng)域全面發(fā)揮C6678多核DSP的潛力。

繼續(xù)創(chuàng)高性能計(jì)算新“低

    C6678基于C66x KeyStone架構(gòu),是目前業(yè)界最高性能的量產(chǎn)多核DSP,具有8個(gè)1.25 GHz DSP 內(nèi)核,可在10 W功耗下實(shí)現(xiàn)160 GFLOP的性能。TI即將推出極致性能、超低功耗的TMS320TCI6609多核DSP,它4倍于C6678性能,32 W就能實(shí)現(xiàn)512 GFLOP的性能。不但可使DSP成為HPC的理想解決方案,而且還正改變著開發(fā)人員選擇應(yīng)用解決方案的方式。將于2012年提供樣片的TCIC6609代碼兼容于C6678 DSP,有助于開發(fā)人員重復(fù)使用現(xiàn)有軟件,保護(hù)其對TI 多核DSP 的投資。

    TMS320C6678與TMS320TCI6609非常適合諸如油氣勘探、金融建模以及分子動(dòng)力學(xué)等需要超高性能、低功耗以及簡單可編程性的計(jì)算應(yīng)用。

助力簡化HPC開發(fā)

    TI提供功能強(qiáng)大的軟件開發(fā)工具以及低成本評估板(EVM),還特別提供針對科學(xué)計(jì)算優(yōu)化的庫,無需花費(fèi)時(shí)間優(yōu)化代碼,便可更便捷地實(shí)現(xiàn)最高性能,而且還支持C與OpenMP等標(biāo)準(zhǔn)編程語言,因此開發(fā)人員可便捷地移植應(yīng)用,充分發(fā)揮低功耗與高性能優(yōu)勢。在這方面,TI的確下了很大的功夫,TI與德州大學(xué)奧斯汀分校(UT Austin)成功將該??茖W(xué)計(jì)算高密度線性代數(shù)庫(libflame 庫)移植至TI TMS320C6678多核DSP,該移植可帶來所有l(wèi)ibflame功能,能夠?yàn)橛蜌饪碧健⒔鹑诮R约胺肿觿?dòng)力學(xué)等眾多HPC應(yīng)用提供基本軟件構(gòu)件組塊,成為多內(nèi)核創(chuàng)新的又一里程碑。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。