上一期講解了DSP編程技巧之:編譯流程與處理器選項(xiàng),這期繼續(xù)講解程序優(yōu)化。在二三十年前人們剛開始使用C語言代替匯編進(jìn)行開發(fā)的時(shí)候,因?yàn)楫?dāng)初的處理器/控制器性能很弱,而編譯器的能力也有限,所以形成了一些C語言編程效率不高的印象。但是今天的硬件性能已經(jīng)非常強(qiáng)大,而編譯器的能力也是日新月異,如果我們不熟練掌握匯編編程中的一些關(guān)鍵技術(shù),編寫的匯編代碼的效率已經(jīng)很難超過編譯器從C語言轉(zhuǎn)換出來的匯編代碼了。
如果我們使用C語言進(jìn)行編程的話,編譯器除了可以把我們的加減乘除這樣的操作轉(zhuǎn)換為ADD、MPY以及相關(guān)的尋址、寄存器操作外,還可以在編譯產(chǎn)生匯編代碼的過程中進(jìn)行不同程度的優(yōu)化。優(yōu)化的過程要根據(jù)器件的特點(diǎn)與指令集等進(jìn)行有針對(duì)性的配置,所以在不同的器件上同一段C代碼優(yōu)化產(chǎn)生的結(jié)果可能不一樣,但是其基本思想都是一致的;甚至是不同公司的編譯器,在優(yōu)化選項(xiàng)和優(yōu)化效果上面也是基本一致的。在CCS軟件的編譯器中,我們可以使用的基本的優(yōu)化級(jí)別有5級(jí),如表1所示。需要注意的是,別名就是我們?cè)诰幾g器選項(xiàng)中實(shí)際使用的名字,因?yàn)樽煮w的原因,看起來可能會(huì)有混淆,以-O0為例,其中的第一個(gè)是字母O是大寫的字母0,表示優(yōu)化Optimization,而不是阿拉伯?dāng)?shù)字的0;第二個(gè)才是是阿拉伯?dāng)?shù)字中的零,用數(shù)字表示優(yōu)化的序號(hào)或者說優(yōu)化的程度。
根據(jù)需要,我們可以選擇需要的優(yōu)化級(jí)別,例如可以選擇優(yōu)化代碼的尺寸,從而減小代碼占用的存儲(chǔ)器空間;一般情況下使用-O2或者-O3可以實(shí)現(xiàn)在代碼運(yùn)行速度、代碼占用的存儲(chǔ)器空間和編譯速度幾個(gè)因素之間的最優(yōu)化。但是優(yōu)化也是有一定的代價(jià)的,首先編譯的時(shí)間會(huì)隨著優(yōu)化級(jí)別的提高而增加;其次如果我們的代碼不夠嚴(yán)謹(jǐn),可能會(huì)產(chǎn)生意外的結(jié)果,例如某些看起來沒用的變量直接被編譯器給“忽視”了,但是我們本來保留它可能是有目的的,例如用來做為調(diào)試用的變量,結(jié)果它被優(yōu)化掉了而失去了意義,這時(shí)我們就需要使用一些特殊的C語言關(guān)鍵字告訴編譯器,這個(gè)變量用在這里是有其它目的的,不能把它給優(yōu)化掉,等等;這些以后可以詳解。
關(guān)于優(yōu)化的更多細(xì)節(jié),大家可以參考一些有關(guān)高效編程的書,因?yàn)榫幾g器雖然可以對(duì)代碼進(jìn)行優(yōu)化,如果我們的代碼寫的太爛,編譯器估計(jì)也要吐血了。
在上面的文章里,我們提到了DSP編程中程序優(yōu)化最常使用到的選項(xiàng)問題,主要提到的幾個(gè)選項(xiàng)包括-O1、-O2、-O3、-O4等等。雖然我們是以DSP為例進(jìn)行說明的,但是對(duì)于其它的處理器,例如ARM、CPU、一些高級(jí)的單片機(jī)如MSP430、PIC等等和一些編譯環(huán)境,例如Keil、Xilinx SDK等,它們使用的一般的優(yōu)化選項(xiàng)和基本內(nèi)容也是大同小異的,即同樣的優(yōu)化級(jí)別,優(yōu)化的目的都是基本一致的。
這些都是基本的操作,如果我們的目的僅僅是優(yōu)化代碼性能或者尺寸的話。如果我們想了解優(yōu)化過程中產(chǎn)生和使用的更多信息的話,對(duì)于DSP本身而言,它的一些其它特性對(duì)于程序的運(yùn)行性能也是非常關(guān)鍵的,此時(shí)在基本的優(yōu)化選項(xiàng)基礎(chǔ)上,我們又要注意一下高級(jí)的優(yōu)化選項(xiàng)的影響。例如,某些匯編指令在做諸如FFT變化的時(shí)候能夠成倍的提高效率,所以開啟高級(jí)優(yōu)化選項(xiàng)使得編譯器有針對(duì)性地生成相關(guān)的指令就非常重要。下面我們看一下編譯器的高級(jí)優(yōu)化選項(xiàng)有哪些。因?yàn)橐紤]到指令集等因素,這里以C28x系列為例進(jìn)行分析。