每個系統(tǒng)要正常運行都有賴于CPU 的性能, 系統(tǒng)軟件, 中間件一集各種系統(tǒng)策略等等, 智能手機(jī)也是一樣。這篇文章主要探討了給智能手機(jī)選擇合適的CPU, 以及在手機(jī)電源管理中的動態(tài)電源管理(DPM) 和自適應(yīng)電壓調(diào)整(AVS) 技術(shù)。最后, 我還對手機(jī)軟件設(shè)計進(jìn)行一點優(yōu)化工作, 實現(xiàn)了軟件的節(jié)能設(shè)計。
引言
智能手機(jī)中包含了很多耗能設(shè)備, 諸如MP3、MPEG- 4、Wi-Fi、數(shù)碼相機(jī)、3D 游戲等等。在手機(jī)電池容量還沒有實現(xiàn)質(zhì)的飛躍的前提下, 我們不得不考慮手機(jī)電源節(jié)能的問題。我主要通過了以下四個方面來闡述在基于Linux 平臺上的智能手機(jī)的解決方案。
CPU 的選擇
盡管現(xiàn)在有了各種在不過多加重功耗負(fù)擔(dān)的前提下提高性能的技術(shù), 但用一個芯片來處理這么多各種各樣的任務(wù), 恐怕已經(jīng)不是一個很好的選擇了。一是因為這些功能對芯片處理功能的要求可能各不相同, 二是因為一個負(fù)擔(dān)著如此眾多任務(wù)的芯片勢必需要很高的速度, 降低功耗變得很困難。
在這種情況下, 多CPU 系統(tǒng)(MPCore)成為一個必然的趨勢。多CPU 系統(tǒng)的一個明顯的優(yōu)勢是: 針對不同的任務(wù)處理需要, 不同的CPU 可以各盡其職, 將自身的優(yōu)勢充分發(fā)揮, 由此帶給手機(jī)最優(yōu)化的性能表現(xiàn)。另一個優(yōu)勢顯然還是體現(xiàn)在對功耗的控制上: 假如用單CPU 來完成所有的功能, 不可避免地需要一個很高的CPU 速度, 從而造成很高的功耗。用一顆高速CPU 來完成這樣的任務(wù), 無疑是大牛拉小車, 同時浪費很多能源。多CPU 系統(tǒng)可以根據(jù)不同的任務(wù)需要合理地啟動、停止相應(yīng)的CPU 來完成任務(wù),不需要的時候處于停歇狀態(tài), 實現(xiàn)最大限度地控制功耗。
既然我們選擇了多CPU 的架構(gòu), 那么接下來CPU 的性能就是我們要考慮的第二大問題。一般的情況下, 我們是在CPU 的性能( Performance) 和功耗(Power Consumption) 方面進(jìn)行比較和選擇。通??梢圆捎妹繄?zhí)行1M次指令所消耗的能量來進(jìn)行衡量, 即Watt/MIPS。
我們把CPU 的功率消耗分為兩大部分: 內(nèi)核消耗功率PCORE和外部接口控制器消耗功率PI/O, 總的功率等于兩者之和, 即PPCORE+PI/O。對于PCORE, 關(guān)鍵在于其供電電壓和時鐘頻率的高低; 對于PI/O 來講, 除了留意各個專門I/O 控制器的功耗外, 還必須關(guān)注地址和數(shù)據(jù)總線寬度。
在數(shù)字集成電路設(shè)計中, CMOS 電路的靜態(tài)功耗很低, 與其動態(tài)功耗相比基本可以忽略不計。CMOS 電路動態(tài)功耗的計算公式如下:
Pd=CT*V2*f, 其中Pd 是CMOS 芯片的動態(tài)功耗, C是CMOS芯片的負(fù)載電容, V 是CMOS 芯片的工作電壓, f 是CMOS 芯片的工作頻率。
由上可見, 當(dāng)CPU 確定后, 我可以通過降低頻率和電壓來減少系統(tǒng)的功耗。
在CPU 的選擇方面, 我們推薦采用Intel 的Xscale 芯片, 以及IBM的PowerPC405G 芯片。
動態(tài)電源管理(DPM)
系統(tǒng)不可能始終處于滿負(fù)荷狀態(tài), 因為系統(tǒng)的工作量隨時都在改變。動態(tài)電源管理(DPM) 通過選擇性的將空閑的系統(tǒng)組件置于低能耗狀態(tài)實現(xiàn)了系統(tǒng)整體能耗的最優(yōu)化。
我們更為關(guān)注的是DPM在Linux 框架結(jié)構(gòu)下的實現(xiàn)。圖1 展示了電源管理和嵌入式Linux 堆棧之間的關(guān)系。
以下是一些于電源管理相關(guān)的接口以及API:
內(nèi)核接口。在針對Linux 的DPM 架構(gòu)中, 內(nèi)核中的DPM 子系統(tǒng)負(fù)責(zé)維持系統(tǒng)的電源狀態(tài), 并把DPM 系統(tǒng)的各個電源得到管理的元件聯(lián)系在一起。DPM 子系統(tǒng)通過多個API 直接與設(shè)備驅(qū)動程序通信, 這些API 把驅(qū)動程序從完全運行狀態(tài)轉(zhuǎn)為各種電源得到管理的狀態(tài)。策略管理器( 或應(yīng)用軟件自身) 通過多個API向DPM 子系統(tǒng)提供指導(dǎo), 這些API 定義各種策略, 并在定義好的運行點之間轉(zhuǎn)移整個系統(tǒng)。
驅(qū)動程序接口。啟用了DPM 的設(shè)備驅(qū)動程序比默認(rèn)驅(qū)動程序具有更多“狀態(tài)”: 由外部事件通過各種狀態(tài)來驅(qū)動它們, 或通過來自內(nèi)核DPM 子系統(tǒng)的回調(diào)來驅(qū)動它們, 從而反映并遵循運行策略。驅(qū)動程序API 還允許驅(qū)動程序登記它們連接和管理的各個設(shè)備的基本運行特征, 從而實現(xiàn)更精細(xì)的策略決策。
用戶程序API, 用戶程序( 應(yīng)用軟件) 分為三類:
(1)可感知電源管理的應(yīng)用軟件;
(2)可感知電源管理的“包裝器”中的傳統(tǒng)應(yīng)用軟件;
(3)不帶電源管理的傳統(tǒng)應(yīng)用軟件。
可感知電源管理的應(yīng)用軟件能夠充分利用來自策略管理器的API, 從而建立各自的基礎(chǔ)約束, 并強制電源管理策略發(fā)生變化, 以便匹配各自的執(zhí)行要求。不直接帶有電源管理功能的傳統(tǒng)應(yīng)用軟件可以“包裝”到代碼或補丁中, 從而實現(xiàn)相當(dāng)?shù)男Ч? 它們還可以按照默認(rèn)行為來運行, 這取決于更寬范圍的默認(rèn)策略管理。
嵌入式Linux DPM 下的實際機(jī)制包括各種API, 比如dpm_set_os ()( 內(nèi)核) 、assert_constraint ()、remove_constraint () 和set_operating_state () ( 內(nèi)核和驅(qū)動程序) 、set_policy () 和set_task_state()( 經(jīng)由系統(tǒng)調(diào)用的用戶級接口) , 以及/proc 接口。
電源管理策略在系統(tǒng)電源管理中扮演了極為關(guān)鍵的角色。DPM的策略抽象模型的執(zhí)行體系類似于狀態(tài)機(jī)。在DPM中有2個概念很重要: 一個是執(zhí)行點(operating points), 另一個是執(zhí)行狀態(tài)( operating states) 。DPM的執(zhí)行點來自一些獨立的系統(tǒng)參數(shù), 包括執(zhí)行電壓, 頻率, 以及總線帶寬等等。隨著事件的改變, 系統(tǒng)的狀態(tài)也不斷的改變( 如圖2 所示) 。在DPM中, 每個系統(tǒng)狀態(tài)都是一個執(zhí)行狀態(tài), 包括空閑態(tài)、活動態(tài)和睡眠態(tài)。
自適應(yīng)電壓調(diào)整(AVS)
在CPU 的選擇部分, 我們知道了系統(tǒng)能耗是與電壓和頻率緊密相關(guān)的。現(xiàn)在我們來探討一下調(diào)整電壓在降低能耗方面的作用。在電壓調(diào)整方面, 自適應(yīng)電壓調(diào)整是一種很有效的方法。自適應(yīng)電壓調(diào)整AVS(Adaptive Voltage Scaling)是通過反饋機(jī)制將電源電壓調(diào)整到給定工作負(fù)載(處理量)所需的最小值。這種閉環(huán)方式可進(jìn)一步減小功耗, 但需要將部分電源管理電路置入主處理器。
成功實現(xiàn)AVS 的關(guān)鍵是在基帶芯片中集成部分系統(tǒng)電源管理電路, 即內(nèi)置AVS 控制器(圖3)。這一關(guān)鍵模塊包含專門的電路和算法, 用來確定給定處理量下的最優(yōu)電壓。通過向電壓調(diào)整器的參考端輸入饋送誤差信號, 可以生成最優(yōu)的VDD, 無需提供不必要的電壓余量, 從而減少了電能損耗。對任何閉環(huán)方法來說, 環(huán)路帶寬都是很重要的。環(huán)路快速跟蹤并穩(wěn)定的能力決定了基帶電源動態(tài)調(diào)整以自適應(yīng)工作負(fù)載突變的能力。
通過軟件方法降低設(shè)備功耗
低能耗軟件優(yōu)化對于基于處理器系統(tǒng)的應(yīng)用程序而言, 是最有發(fā)展前途的降低系統(tǒng)能耗的技術(shù)方法。這種方法對于那些計算復(fù)雜度較高的應(yīng)用程序最為有效。因為只有在應(yīng)用程序執(zhí)行的時候, 才會消耗大量電源。
這項技術(shù)的最終目的是在執(zhí)行較為復(fù)雜的應(yīng)用程序時, 盡量降低能耗。我們的程序用于降低計算的復(fù)雜度, 但不能改變程序原本的行為?,F(xiàn)在我們通過圖4(A) 中的例子, 來闡述一下一些有關(guān)軟件優(yōu)化的想法。
考慮主函數(shù)中第一次調(diào)用過程test。如果檔參數(shù)a 和差數(shù)k都是0 的概率為90%, 我們可以將源代碼改寫為圖4(B) , 通過改寫, 我們減少了test 過程中的循環(huán)數(shù)。但在現(xiàn)實中, 參數(shù)a 和k 并不是總是為0。那么test 的過程調(diào)用不能被新的過程sp_test 所完全替代。我們用一個條件語句來限定過程的調(diào)用, 所有的過程調(diào)用依賴于cvd_test()的結(jié)果。當(dāng)過程cvd_test()檢測為一般情況( a,k同時為0) , 符合此條件的修正后的代碼被執(zhí)行。如果當(dāng)過程cvd_test()檢測為非一般情況( a,k 非同時為0) , 原有的代碼被執(zhí)行。在另一方面, 當(dāng)過程cvd_test()檢測為非一般情況, 我們提升了程序的計算復(fù)雜度, 也相應(yīng)提高了能耗。
一般而言, 對代碼優(yōu)化有各種各樣不同的方法。如果我不考慮參數(shù)k, 我們可以將源代碼轉(zhuǎn)化為圖4(C) 所示。a 為0 的概率大于a 和k 同時為0 的概率。在不同情況下, 對原有代碼所做的修改有不同的效果。
最后, 我們必須檢驗修改過的代碼對原有代碼的影響, 是不是改變了原有代碼的行為, 在任何條件下我們都不能去擅自改變原有代碼的行為。代碼質(zhì)量的提升也是相當(dāng)?shù)闹匾?。對于C 語言來說, 將一些簡單的函數(shù)轉(zhuǎn)換為宏定義時一種比較有效的方法。
綜上所述, 我們可以將一般情況下代碼優(yōu)化分為4 個步驟:
(1)一般案例的選擇。選擇最有效的、最長被調(diào)用的案例。
(2)一般案例的提煉。為給出的一般案例建立一個過程。
(3)全局檢測。檢測改變后的調(diào)用對于全局的影響。
(4)提高代碼質(zhì)量。使用一些編程語言中的基本技巧, 以提高代碼質(zhì)量。
總結(jié)
在移動終端設(shè)備設(shè)計方面, 節(jié)能成為了一個很重要的設(shè)計指標(biāo)。我們選取了更高效的CPU 以降低能耗。對于交互式應(yīng)用程序而言, 我們使用DPM策略降低處于空閑態(tài)的能耗, 這種方法主要使用于OS 層。而AVS 技術(shù)是通過電壓調(diào)整來實現(xiàn)減少能耗。在應(yīng)用程序?qū)? 我們通過對軟件的優(yōu)化來達(dá)到降低能耗的目的。在Intel? PXA27x 處理芯片環(huán)境下, 通過以上方法, 我們降低了26%的能耗, 提高了30%的系統(tǒng)性能以及增加了7%的代碼量。