摘要:通過分析Cortex-M3內(nèi)核的結(jié)構(gòu)與浮點型格式,充分利用Cortex-M3內(nèi)核中的分支預(yù)測、單周期乘法、硬件除法等眾多功能強大的特性,使用Thumb-2指令集實現(xiàn)了單精度浮點型的加、減、乘、除與比較運算,并給出了加減法運算的流程圖和除法運算的源程序。
關(guān)鍵詞:Cortex-M3內(nèi)核;浮點型;速度
引言
在一些較為復(fù)雜的運算中,經(jīng)常需要處理取值范圍大、精度高的浮點型數(shù)據(jù)。但一般的低端嵌入式內(nèi)核中沒有浮點型硬件運算器,因此處理語音信號等數(shù)據(jù)比較困難。本文提出了一種基于Cortex-M3內(nèi)核的浮點型運算的處理方法。
1 Thumb-2指令集與COrtex-M3內(nèi)核結(jié)構(gòu)
Thumb-2指令集具有以下優(yōu)點:許多指令(包括乘法相關(guān)指令、突破性的32位硬件除法指令等)都是單周期的,并且位段處理指令取指都按32位處理。
Cortex-M3是一個32位處理器內(nèi)核,采用哈佛結(jié)構(gòu),擁有獨立的指令總線和數(shù)據(jù)總線,可以讓取指與數(shù)據(jù)訪問并行不悖。它具有如下特點:功耗低,有睡眠、停機和待機3種模式;實時性好;響應(yīng)中斷快,而且響應(yīng)中斷所需的周期數(shù)是確定的;采用Thumb-2指令集,使得代碼
密度和執(zhí)行效率更高。
2 浮點數(shù)的格式
IEEE的浮點型數(shù)據(jù)標準規(guī)定,浮點數(shù)具有單精度(4字節(jié))、雙精度(8字節(jié))和擴展精度(10字節(jié))三種浮點型格式。在實際的應(yīng)用中,使用最多的是單精度浮點數(shù),格式如下:
浮點數(shù)表示為:X=MsEsEm-1…E1E0 M-1M-2…M-n。IEEE標準規(guī)定:階碼用移碼;尾數(shù)的符號位用1表示負數(shù),0表示正數(shù);尾數(shù)的數(shù)據(jù)位用原碼表示,并且隱藏了第24位(即M-1),M-1為1,所以尾數(shù)是大于等于0.5小于1的小數(shù)。
階碼用移碼表示、尾數(shù)用原碼表示浮點數(shù)的好處:
①浮點數(shù)據(jù)零的所有位均為零。
②2個浮點數(shù)比較大小時,可不必區(qū)分階碼位和數(shù)據(jù)位,視為有符號32位整型數(shù)據(jù)比較。
3 浮點型運算的具體實現(xiàn)
3.1 加減運算
Cortex-M3是32位的內(nèi)核,可以把單精度浮點數(shù)存儲為32位的有符號整數(shù),這樣便于比較運算。加減運算的流程如圖1所示。
3.2 乘法運算
對于浮點型乘法運算,因為Cortex-M3內(nèi)核支持單周期乘法指令,所以運算速度比較快。運算流程與加減運算相似,不同之處有:階碼相加最高位取反得結(jié)果的階碼;尾數(shù)不用正負號調(diào)整,直接相乘,而尾數(shù)的符號位異或即可得結(jié)果的符號位;兩個24位尾數(shù)相乘的結(jié)果為48位,尾數(shù)規(guī)格化的時候,判斷第48位是否為1,如果為1則階碼加1,如果為O則第47位一定為1,階碼不必調(diào)整。
3.3 除法運算
除法運算中,提取階碼、重現(xiàn)尾數(shù)、提取尾數(shù)以及尾數(shù)符號位的操作與乘法運算相同,因此除法運算過程與乘法運算過程的基本相似,只是計算X、Y尾數(shù)的商有所不同。
計算商的方法為:先把X的尾數(shù)左移8位,與Y的尾數(shù)相除得結(jié)果Z1,并計算出余數(shù)W1=X-Z1*Y;W1先左移8位,與Y的尾數(shù)相除得結(jié)果Z2,并計算出余數(shù)W2=W1-Z2*Y;W2左移8位,與Y的尾數(shù)相除得結(jié)果Z3。調(diào)整Z1、Z2、Z3并組裝成24位或25位尾數(shù)。除法運算的源程序如下:
3.4 浮點型數(shù)據(jù)比較
從浮點型數(shù)據(jù)存儲的格式來看,可以把浮點數(shù)按照有符號整型數(shù)據(jù)來比較大小。比較的結(jié)果:相等輸出O,大于輸出1,小于輸出-1。
4 測試結(jié)果
利用基于Cortex-M3內(nèi)核的STM32F103VET6處理器測試浮點型運算的速度,處理器的工作頻率為72 MHz,測試的方法為:每完成一次浮點型運算,處理器的一引腳變化一次電平。經(jīng)測試,變化一次電平耗時153ns。圖2、圖3是對乘法運算和除法運算的測試結(jié)果。從圖中可以看出,乘法的運算速率約為0.717μs/次,除法的運算速率約為0.957μs/次??梢?,運算速率比較高,精度較高,可以滿足實際應(yīng)用要求。
結(jié)語
測試結(jié)果表明,在Cortex-M3內(nèi)核上實現(xiàn)浮點型運算,可以達到所要求的精度,運算速度較快,具有較高的實時性。本文提出的浮點型運算的處理方法在基于Cortex-M3內(nèi)核的處理器上有著較高的應(yīng)用價值。希望對從事這方面的人員有所幫助。