《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于ARM Linux的Gameboy模擬器移植和優(yōu)化研究
基于ARM Linux的Gameboy模擬器移植和優(yōu)化研究
嵌入式在線
顧葉鋒 付宇卓 魯欣
摘要: 本文構(gòu)建了一個(gè)基于ARM920T嵌入式Linux的實(shí)驗(yàn)平臺(tái)環(huán)境, gnuboy作為一種虛擬機(jī),應(yīng)用到這樣的嵌入式環(huán)境中遇到的問(wèn)題具有一定的代表性,最需要解決的問(wèn)題是速度問(wèn)題,針對(duì)于此,本文實(shí)現(xiàn)了它在所構(gòu)建的平臺(tái)上的移植和一些優(yōu)化研究。
關(guān)鍵詞: ARM ARM920T Linux
Abstract:
Key words :

引言

  面向ARM微處理器構(gòu)架的嵌入式操作系統(tǒng)的使用量這些年持續(xù)增長(zhǎng),在各種嵌入式操作系統(tǒng)中, L inux是獲得支持最多的第三大力量。

  目前,ARM L inux支持包括ARM610、A RM710、ARM720T cores、ARM920T" title="ARM920T">ARM920T cores、StrongARM 110、StrongARM1100、XScale等系列的ARM處理器。

  Gameboy是目前比較流行的8位掌上游戲機(jī),通常被簡(jiǎn)稱為GB,它的最終態(tài)Game Boy Color (GBC)是完全向后兼容的。Gnuboy是GB /GBC的軟件模擬器,是一種自由軟件,它是基于Qt系統(tǒng)的,能夠運(yùn)行幾乎所有的黑白和彩色的GB /GBC游戲ROM,但運(yùn)行復(fù)雜一些的游戲需要在速度上得到加強(qiáng),同時(shí)它的聲音還沒(méi)有得到測(cè)試。

  Gnuboy已經(jīng)實(shí)現(xiàn)了i386匯編代碼的一些優(yōu)化工作,能夠在奔騰機(jī)器上運(yùn)行良好,除此之外,到目前為止,它能夠運(yùn)行的平臺(tái)還很有限。隨著嵌入式系統(tǒng)設(shè)計(jì)技術(shù)的發(fā)展,PDA、Smartphone等嵌入式產(chǎn)品的功能不斷地得到擴(kuò)展,適應(yīng)用戶的需要, Gnuboy在嵌入式產(chǎn)品中的移植應(yīng)用非常具有前景。目前Gnuboy在ARM Linux" title="Linux">Linux下還沒(méi)有得到很好的應(yīng)用,本文就是在構(gòu)建的基于ARM920T Linux的嵌入式平臺(tái)上對(duì)gnuboy運(yùn)用進(jìn)行的嘗試性工作,同時(shí), Gnuboy作為一種虛擬機(jī)技術(shù),本文的工作對(duì)研究虛擬機(jī)技術(shù)在ARM L inux中的應(yīng)用也具有一定的價(jià)值。

  硬件環(huán)境

  本實(shí)驗(yàn)測(cè)試板采用Motorola公司的MX1 Lite,系統(tǒng)的主要模塊有處理器內(nèi)核模塊、用戶接口模塊、連接設(shè)備模塊等,如圖1所示,下面分別進(jìn)行介紹。

1)處理器內(nèi)核模塊采用v4T體系結(jié)構(gòu)的ARM920T 內(nèi)核擁有16K的指令緩存和16K的數(shù)據(jù)緩存; 外部接口模塊提供了最多6 個(gè)片選信號(hào)來(lái)訪問(wèn)外部設(shè)備,其中連接的12Kx16bits的NOR Flash 經(jīng)過(guò)配置用于系統(tǒng)啟動(dòng); SDRAM 控制器提供了對(duì)使用32Mx32bits的SDRAM的訪問(wèn)控制。

  2)用戶接口模塊由于MX1 L ite沒(méi)有模擬信號(hào)處理模塊,無(wú)法直接接收觸摸屏的輸入,所以本系統(tǒng)采用了TI的TSC2301芯片來(lái)支持觸摸屏的輸入功能,它與主芯片通過(guò)連續(xù)外設(shè)接口協(xié)議連接,它不僅可以接收觸摸屏的輸入,而且它還支持聲音數(shù)模轉(zhuǎn)換和輸入輸出等功能; LCD 控制器用于給外部液晶顯示屏提供顯示數(shù)據(jù),LCD采用了Sharp 的20x240 HR - TFT LCD,它支持觸摸屏輸入,分辨率為320x240。

  3)連接設(shè)備模塊包含有多媒體卡/數(shù)字安全主機(jī)控制模塊、內(nèi)存棒控制器和智能卡接口,以此來(lái)連接用于外部存儲(chǔ)的多媒體卡。

  Gnuboy軟件結(jié)構(gòu)和一些工具軟件

  Gnuboy是基于Qt系統(tǒng)的,可從圖2中看出它和整個(gè)系統(tǒng)的關(guān)系。本文構(gòu)建的基于ARM920T的嵌入式L inux平臺(tái)下采用的是嵌入式系統(tǒng)的QT 版本: QT/Embedded 和Qtop ia(QPE) ,這有助于模擬器的移植。

QT/Embedded和Qtopia

  QT/Embedded和Qtopia是著名的QT庫(kù)開(kāi)發(fā)商TrollTech開(kāi)發(fā)的基于Framebuffer、面向嵌入式系統(tǒng)的QT版本。它的特點(diǎn)是界面美觀、色彩配比好,使用與QT/Windows和QT/X11 完全一致的AP I接口,許多基于QT的程序可以非常方便地移植到嵌入式系統(tǒng)。Qtopia 包括了全套的個(gè)人信息管理PIM,如地址本、日程安排、游戲、配置工具等。QT/Embedded實(shí)現(xiàn)了對(duì)下層輸入設(shè)備的驅(qū)動(dòng)和底層圖形接口以及各基類和AP I,它在編譯后生成函數(shù)庫(kù)被應(yīng)用程序調(diào)用。Qtopia也是以客戶/服務(wù)器的方式,通過(guò)消息機(jī)制來(lái)管理各種應(yīng)用程序。圖3描述了QT應(yīng)用程序的執(zhí)行方式及系統(tǒng)結(jié)構(gòu),其中X Server是核心。

一些工具軟件

  移植前需要在宿主機(jī)上建立ARM 的交叉編譯環(huán)境,主要用到的開(kāi)發(fā)工具包括三個(gè)部分: binutils、gcc、glibc。

  ● Binutils — 用于操作二進(jìn)制文件的實(shí)用程序集合,包括諸如匯編器as、二進(jìn)制轉(zhuǎn)換工具( objdump、objcopy) 等這樣的實(shí)用程序;

  ● Gcc — GNUC編譯器(C編譯器gcc和C + +編譯器g + + ) ;

  ● Glibc —所有應(yīng)用程序?qū)㈡溄拥降腃庫(kù)。

  可以直接從Internet上下載已經(jīng)編譯的二進(jìn)制文件安裝到PC機(jī)上,并相應(yīng)設(shè)置比如路徑等這樣一些比較簡(jiǎn)單的參數(shù)即可使用,但必須保證編譯時(shí)所用的函數(shù)庫(kù)版本與目標(biāo)板上運(yùn)行時(shí)所使用的函數(shù)庫(kù)版本的一致。ARM Developer Suite它是全套的實(shí)時(shí)開(kāi)發(fā)軟件工具包,編譯器生成的代碼密度和執(zhí)行速度優(yōu)異,可快速低價(jià)地創(chuàng)建ARM結(jié)構(gòu)應(yīng)用。

  移植和優(yōu)化

  Gnuboy是一種虛擬機(jī)機(jī)制,它對(duì)具體硬件的操作是通過(guò)操作系統(tǒng)(這里是L inux)來(lái)進(jìn)行的,圖4 為它對(duì)基于ARMlinux平臺(tái)硬件操作的抽象層次。

這個(gè)抽象層次也適用于在ARM Linux平臺(tái)下用C語(yǔ)言編寫(xiě)的一般虛擬技術(shù)應(yīng)用。越是頂層越是抽象,代碼可移植性就越好;越是底層,越是硬件相關(guān),代碼可移植性就越差,但代碼執(zhí)行速度越快。這也是一般虛擬機(jī)移植和優(yōu)化思想的體現(xiàn),提高移植性,多運(yùn)用抽象的接口,提高速度,多一些直接操作硬件的代碼。

  移植

  Gnuboy在此平臺(tái)上的正確運(yùn)行需要解決中斷、提供Framebuffer支持、數(shù)據(jù)存儲(chǔ)格式、字符串到64位整數(shù)轉(zhuǎn)換等問(wèn)題。

  中斷問(wèn)題

  Gnuboy需要依賴宿主操作系統(tǒng)(這里是L inux)來(lái)提供輸入/輸出等基本服務(wù),讓宿主操作系統(tǒng)作為它與硬件設(shè)備的中間人,這種游離于硬件通信細(xì)節(jié)之外的方法具有良好的可移植性,本文要解決的主要是提供對(duì)鍵盤(pán)輸入和游戲控制終端的中斷響應(yīng)和處理。

  在本文構(gòu)建的平臺(tái)下,需要編寫(xiě)相應(yīng)的鍵盤(pán)和游戲控制終端的Linux驅(qū)動(dòng)程序,以模塊方式加載后,在Gnuboy中打開(kāi)該設(shè)備。對(duì)應(yīng)鍵盤(pán)處理,在Gnuboy中需要調(diào)整相應(yīng)的鍵盤(pán)設(shè)置代碼使之與系統(tǒng)一致。

  提供Framebuffer支持

  Framebuffer技術(shù)提供了一個(gè)訪問(wèn)物理圖形設(shè)備的定義良好的接口,本文構(gòu)建的平臺(tái)下采用的是Qt系統(tǒng)的嵌入式版本,它是基于Framebuffer的, Gnuboy要在該平臺(tái)下運(yùn)行,必須提供對(duì)Framebuffer的支持。通過(guò)訪問(wèn)/dev/ fb0來(lái)取得系統(tǒng)framebuffer中用于顯示圖像的數(shù)據(jù)和進(jìn)行處理。在Gnuboy中調(diào)用游戲畫(huà)面的Framebuffer地址和掃描方法也需要作響應(yīng)的修改。

  修改Framebuffer地址,也就是獲得游戲畫(huà)面的開(kāi)始地址在內(nèi)存中的位置。針對(duì)采用的LCD 的分辨率, 需要在Gnuboy中計(jì)算Framebuffer地址處做出相應(yīng)修改。對(duì)于本平臺(tái)中采用的LCD, Gnuboy刷新處理方法是從第一行開(kāi)始,逐行刷新,同時(shí)由于一個(gè)像素采用兩個(gè)字節(jié),因此在逐行刷新時(shí),每次寫(xiě)兩個(gè)字節(jié)。

  數(shù)據(jù)存儲(chǔ)格式和字符串到64位整數(shù)轉(zhuǎn)換

  在ARM Linux下可配置成大數(shù)端或者小數(shù)端格式來(lái)保存和處理整數(shù)數(shù)值,在Gnuboy中與數(shù)值存儲(chǔ)字節(jié)順序有關(guān)的代碼需要與之對(duì)應(yīng)。

  Linux明顯缺乏用來(lái)把整數(shù)字符串轉(zhuǎn)換為64位整數(shù)的函數(shù),如果字符串參數(shù)突破32位的極限,就有可能出問(wèn)題,因此在Gnuboy需要提供字符串到64位整數(shù)的的轉(zhuǎn)換函數(shù)。

  設(shè)置啟動(dòng)模擬器路徑和編譯

  在用戶已經(jīng)選擇好游戲Rom,點(diǎn)擊launch simulator按鈕觸發(fā)啟動(dòng)模擬器,進(jìn)入游戲功能,因此在Gnuboy代碼中需要獲得rom的絕對(duì)路徑,由于QT操作系統(tǒng)無(wú)法在代碼中直接運(yùn)行qtop iagnuboy命令,因此需要給出該可執(zhí)行文件的絕對(duì)路徑。

  源代碼修改好以后,在Makefile中設(shè)定交叉編譯器: CC= arm - linux - gcc, CXX = arm - linux - g + +。編譯時(shí)要用到針對(duì)ARM的函數(shù)庫(kù)可以把函數(shù)庫(kù)放在一個(gè)自己建的一個(gè)目錄,為了讓gcc 在搜索函數(shù)庫(kù)時(shí)到指定的目錄中尋找,可在Makefile的通過(guò)- L參數(shù)添加存放針對(duì)ARM函數(shù)庫(kù)的目錄。例如QTOP IA L IBS = - L $(QPED IR) / lib。

  經(jīng)過(guò)交叉編譯后把得到的可執(zhí)行文件qtop iagnuboy和qtop iagnuboyl燒到嵌入式系統(tǒng)中可以運(yùn)行,然后不足之處是畫(huà)面速度有些慢,這正是下面優(yōu)化要研究的問(wèn)題。

  Gnuboy在ARM L inux下的優(yōu)化

  優(yōu)化概述

  如果說(shuō)CISC的指導(dǎo)思想之一是為了減輕編譯的負(fù)擔(dān),R ISC則向編譯提出了更高的要求,ARM作為一種R ISC體系結(jié)構(gòu),優(yōu)化問(wèn)題顯得非常重要。從圖4 的抽象層次可以知道,對(duì)Gnuboy的優(yōu)化問(wèn)題,概括來(lái)說(shuō)是對(duì)它一些抽象代碼進(jìn)行硬件相關(guān)代碼替代的過(guò)程,并且越是底層的代碼,速度越快,這里直接用ARM匯編語(yǔ)言來(lái)改寫(xiě)一些原來(lái)的C函數(shù)。前面的移植運(yùn)行結(jié)果已經(jīng)顯示, Gnuboy的圖像顯示較慢。它的函數(shù)void lcd refreshline ( )的主要功能是使用已經(jīng)解碼好的圖像數(shù)據(jù)來(lái)完成游戲畫(huà)面的顯示。對(duì)它的優(yōu)化主要是對(duì)它里面調(diào)用的兩個(gè)用C語(yǔ)言所寫(xiě)函數(shù)updatepatp ix ( )和bg scan color ( )函數(shù)的優(yōu)化。

  本文采用了與機(jī)器相關(guān)優(yōu)化的優(yōu)化技術(shù),與機(jī)器相關(guān)的優(yōu)化這里主要是寄存器分配問(wèn)題,一般寄存器分配算法是基于一種稱為圖著色技術(shù)的。給定一個(gè)無(wú)向圖G= (V , E ) ,V 是有限節(jié)點(diǎn)的集合,V = { v 1, v 2, ., v n} , E是邊的集合, E = { ( i, j ) | v i∈V , v j∈V , v i和v j相連} , 圖著色問(wèn)題要求找到一個(gè)k盡量小的所有節(jié)點(diǎn)的賦值(也稱“完全賦值”) C: V — > {1.k } , 要求在該完全賦值中, 若( i,j ) ∈E , 則C ( v i) ≠C ( vj) 。

  簡(jiǎn)化的圖著色技術(shù)應(yīng)用

  針對(duì)本文的優(yōu)化,第一階段是把C函數(shù)用偽ARM匯編指令(即用符號(hào)寄存器Ui替代真正ARM寄存器的ARM指令)改寫(xiě)。

  第二階段對(duì)符號(hào)寄存器U1~Un ( n > 15)畫(huà)出相干圖并進(jìn)行著色,所謂對(duì)圖進(jìn)行著色是指給圖中的每個(gè)結(jié)點(diǎn)賦予一種顏色,而且所有相鄰的兩個(gè)結(jié)點(diǎn)都具有不同的顏色。這樣,每種顏色就對(duì)應(yīng)于處理器中的一個(gè)實(shí)際的物理寄存器,如此著色保證了所有可能發(fā)生沖突的符號(hào)寄存器都被賦予不同的物理寄存器。

  假設(shè)n + 1個(gè)符號(hào)寄存器的相干圖如圖5 ( a)所示,其中結(jié)點(diǎn)是符號(hào)寄存器,而結(jié)點(diǎn)之間的弧線表示變量的生命周期有重疊,最少需要16種顏色才能避免相連結(jié)點(diǎn)顏色有重疊。由于ARM920T只有r0~r14等15個(gè)寄存器可用于存儲(chǔ)程序變量,小于16,也就是存在寄存器沖突問(wèn)題,這個(gè)時(shí)候就可以通過(guò)選擇刪除一個(gè)結(jié)點(diǎn)(如圖中Un + 1) ,也就是把U6對(duì)應(yīng)的數(shù)據(jù)存儲(chǔ)到存儲(chǔ)器中,以后再重裝入寄存器來(lái)達(dá)到對(duì)各寄存器進(jìn)行釋放的目的,見(jiàn)圖5 ( b)所示,虛線圓圈表示符號(hào)寄存器U16對(duì)應(yīng)的數(shù)據(jù)轉(zhuǎn)存到存儲(chǔ)器中。

用上面介紹的方法對(duì)updatepatp ix和bg scan color函數(shù)進(jìn)行處理,得到的ARM匯編函數(shù),用它們替換掉gnuboy源代碼中原先的C函數(shù)并進(jìn)行編譯生成可執(zhí)行文件,可執(zhí)行文件在構(gòu)建的測(cè)試板上運(yùn)行良好。下面對(duì)上面提到的優(yōu)化來(lái)進(jìn)行一些測(cè)試。

  測(cè)試評(píng)估

  用CodeWarrior forARM Developer Suite和AXD Debugger軟件測(cè)試優(yōu)化前后函數(shù)的運(yùn)行時(shí)間,結(jié)果如表1所示。圖著色技術(shù)強(qiáng)調(diào)實(shí)現(xiàn)活躍變量的100%分配,并且代碼需要寄存器數(shù)量越多,優(yōu)化效果越明顯,這從updatapatp ix和bg scan color函數(shù)的優(yōu)化中可以看出(前者代碼較后者復(fù)雜,需要存放的臨時(shí)變量也多) 。進(jìn)一步優(yōu)化gnuboy,可用類似的方法替換源代碼的另外一些影響速度較大的函數(shù)。

總結(jié)

  本文構(gòu)建了一個(gè)基于ARM920T嵌入式Linux的實(shí)驗(yàn)平臺(tái)環(huán)境, gnuboy作為一種虛擬機(jī),應(yīng)用到這樣的嵌入式環(huán)境中遇到的問(wèn)題具有一定的代表性,最需要解決的問(wèn)題是速度問(wèn)題,針對(duì)于此,本文實(shí)現(xiàn)了它在所構(gòu)建的平臺(tái)上的移植和一些優(yōu)化研究。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。