??? 摘 要:? 在介紹基于ARM體系的嵌入式" title="的嵌入式">的嵌入式系統(tǒng)啟動(dòng)流程的基礎(chǔ)上,結(jié)合編程實(shí)例,詳細(xì)、系統(tǒng)地?cái)⑹隽薆SP(板級(jí)支持包)程序的各個(gè)組成部分及其具體設(shè)計(jì)方法,并就實(shí)際程序設(shè)計(jì)中的幾個(gè)難點(diǎn)問(wèn)題做了說(shuō)明。
??? 關(guān)鍵詞:? ARM? BSP? 嵌入式系統(tǒng)? 微處理器
?
??? ARM公司在32位RISC的CPU開(kāi)發(fā)領(lǐng)域不斷取得突破,其結(jié)構(gòu)已經(jīng)從V3發(fā)展到V6。
??? BSP(Board Support Package)板級(jí)支持包介于主板硬件和操作系統(tǒng)之間,其功能與PC機(jī)上的BIOS相類(lèi)似,主要完成硬件初始化并切換到相應(yīng)的操作系統(tǒng)。BSP是相對(duì)于操作系統(tǒng)而言的,不同的操作系統(tǒng)對(duì)應(yīng)于不同定義形式的BSP,例如VxWorks的BSP和Linux的BSP相對(duì)于某一CPU來(lái)說(shuō),盡管實(shí)現(xiàn)的功能一樣,可是寫(xiě)法和接口定義是完全不同的。另外,仔細(xì)研究所用的芯片資料也十分重要,例如盡管ARM在內(nèi)核上兼容,但每家芯片都有自己的特色。所以這就要求BSP程序員對(duì)硬件、軟件和操作系統(tǒng)都要有一定的了解。
??? 本文介紹基于ARM體系的嵌入式應(yīng)用系統(tǒng)初始化部分BSP的程序設(shè)計(jì)。本文引用的源碼全部是基于HMS30C7202芯片設(shè)計(jì),并已成功運(yùn)行。
1 初始化過(guò)程
??? 盡管各種嵌入式應(yīng)用系統(tǒng)的結(jié)構(gòu)及功能差別很大,但其系統(tǒng)初始化部分完成的操作有很大一部分是相似的。嵌入式系統(tǒng)的啟動(dòng)流程如圖1所示。
?
1.1 設(shè)置入口指針
??? 啟動(dòng)程序首先必須定義入口指針,而且整個(gè)應(yīng)用程序" title="應(yīng)用程序">應(yīng)用程序只有一個(gè)入口指針。一般地,程序在編譯鏈接時(shí)將異常中斷向量表" title="向量表">向量表鏈接在0地址處,并且作為整個(gè)程序的入口點(diǎn)。入口點(diǎn)代碼如下:
??? ENTRY(_start)???????? ;開(kāi)始
1.2 設(shè)置異常中斷向量表
??? ARM要求中斷向量表必須放置在從0開(kāi)始、連續(xù)8×4字節(jié)的空間內(nèi)。各異常中斷向量地址以及中斷的處理優(yōu)先級(jí)如表1:
?
??? 每當(dāng)一個(gè)中斷發(fā)生后,ARM處理器便強(qiáng)制把程序計(jì)數(shù)器(PC)指針置為向量表中對(duì)應(yīng)中斷類(lèi)型的地址值。因?yàn)槊總€(gè)中斷向量?jī)H占據(jù)放置1條ARM指令的空間,所以通常放置1條跳轉(zhuǎn)指令或向程序計(jì)數(shù)器(PC)寄存器賦值的數(shù)據(jù)訪問(wèn)指令,使程序跳轉(zhuǎn)到相應(yīng)的異常中斷處理程序執(zhí)行。如果異常中斷處理程序起始地址小于32MB,使用B跳轉(zhuǎn)指令;如果跳轉(zhuǎn)范圍大于32MB,使用LDR指令。
??? 另外,對(duì)于各未用中斷,可使其指向一個(gè)只含返回指令的啞函數(shù),以防止錯(cuò)誤中斷引起系統(tǒng)的混亂。
1.3 初始化存儲(chǔ)系統(tǒng)
??? 初始化存儲(chǔ)系統(tǒng)的編程對(duì)象是系統(tǒng)的存儲(chǔ)器控制器,一個(gè)系統(tǒng)可能存在多種存儲(chǔ)器類(lèi)型的接口,不同的存儲(chǔ)系統(tǒng)的設(shè)計(jì)不盡相同。Flash和SRAM同屬于靜態(tài)存儲(chǔ)器類(lèi)型,可以合用一個(gè)存儲(chǔ)器端口;而DRAM因?yàn)橛袆?dòng)態(tài)刷新和地址線復(fù)用等特性,通常配有專(zhuān)用的存儲(chǔ)器端口。其中,SDRAM必須在初始化階段進(jìn)行設(shè)置,因?yàn)榇蟛糠值某绦虼a和數(shù)據(jù)都要在SDRAM中運(yùn)行。
??? 在HMS30C7202中,與SDRAM配置有關(guān)的寄存器有4個(gè):配置寄存器、刷新定時(shí)寄存器、寫(xiě)緩沖寫(xiě)回寄存器和等待驅(qū)動(dòng)寄存器,需要根據(jù)實(shí)際的系統(tǒng)設(shè)計(jì)對(duì)此分別加以正確配置。
??? SDRAM的初始化過(guò)程如下:加電→延遲10ms(各具體SDRAM器件延時(shí)時(shí)間可能不同)→設(shè)置配置寄存器參數(shù)→延時(shí)→寫(xiě)刷新定時(shí)寄存器,設(shè)置刷新周期→延時(shí)→使能自動(dòng)刷新→延時(shí)→設(shè)置模式寄存器(位于SDRAM內(nèi)部)。
1.4 存儲(chǔ)器地址分布重映射(remap)和MMU
??? 系統(tǒng)一上電,程序?qū)⒆詣?dòng)從0地址處開(kāi)始執(zhí)行。因此,必須保證在0地址處存在正確的代碼,即要求0地址開(kāi)始處是非易失性的ROM或Flash等。但是因?yàn)镽OM或Flash的訪問(wèn)速度相對(duì)較慢,每次中斷響應(yīng)發(fā)生后,都要從讀取ROM或Flash上面的向量表開(kāi)始,影響了中斷響應(yīng)速度。一般程序執(zhí)行后將SDRAM映射為地址0,并把系統(tǒng)程序加載到SDRAM中運(yùn)行,其具體步驟可以采用以下的方案:
??? (1)上電后,從0地址的ROM開(kāi)始往下執(zhí)行;
??? (2)根據(jù)映射前的地址,對(duì)SDRAM進(jìn)行必要的代碼和數(shù)據(jù)拷貝;
??? (3)拷貝完成后,進(jìn)行重映射操作;
??? (4)因?yàn)镽AM在重映射前準(zhǔn)備好了內(nèi)容,使得PC指針能繼續(xù)在RAM里取得正確的指令。
??? 在這種地址映射的變化過(guò)程中,程序員需要仔細(xì)考慮的是:程序的執(zhí)行流程不能被這種變化所打斷,注意保證程序執(zhí)行流程在重映射前后的承接關(guān)系。
??? 存儲(chǔ)器的地址分配是很靈活的,可以將I/O操作映射成內(nèi)存操作,也可以通過(guò)映射對(duì)某些不可訪問(wèn)的地址空間進(jìn)行保護(hù)等。進(jìn)行存儲(chǔ)器初始化設(shè)計(jì)時(shí),一定要根據(jù)應(yīng)用程序的具體要求來(lái)完成地址分配。對(duì)地址管理通過(guò)MMU即存儲(chǔ)器管理單元實(shí)現(xiàn)。
??? 在ARM系統(tǒng)中,MMU通過(guò)頁(yè)式虛擬存儲(chǔ)管理,將虛擬空間和物理空間分別分成一個(gè)個(gè)固定大小的頁(yè),并建立兩者之間的映射關(guān)系,從而實(shí)現(xiàn)虛擬地址到物理地址的轉(zhuǎn)換。MMU還可完成存儲(chǔ)器訪問(wèn)權(quán)限的控制和虛擬存儲(chǔ)器空間緩沖特性的設(shè)置。
??? 以下是實(shí)現(xiàn)MMU的部分代碼:
??? for(i=1; i<0x1000; i++) {
??? ??pagetable[i] = (i<<20) | MMU_SECDESC;
??? ?}???? ?//建立頁(yè)表,每頁(yè)大小為1MB,頁(yè)表偏移序號(hào)是物理地址的高12位;
??? ??for(addr=SDRAM_BASE; addr < (SDRAM_BASE+SDRAM_SIZE/2); addr += SIZE_1M)
??? ??pagetable[addr >> 20] = addr | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將SDRAM_BASE至(SDRAM_BASE+SDRAM_SIZE/2)空間的設(shè)置為不可CACHE和不可BUFFER的
???? ?for(addr=SDRAM_BASE+SDRAM_SIZE/2; addr< (SDRAM_BASE+SDRAM_SIZE); addr += SIZE_1M)
????? pagetable[addr >> 20] = (addr+0x1000000) | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將這段空間的地址映射關(guān)系設(shè)置為VA(虛擬地址)=PA(物理地址)+0x1000000
??? ??pagetable[0] = (0x42f00000) | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將SDRAM的虛擬地址0x42f00000映射到0處
1.5 初始化各模式下的堆棧指針
??? 因?yàn)锳RM處理器有7種執(zhí)行狀態(tài),每一種狀態(tài)的堆棧指針寄存器(SP)都是獨(dú)立的(System和User模式使用相同SP寄存器)。因此,對(duì)程序中需要用到的每一種模式都要給SP寄存器定義一個(gè)堆棧地址。方法是改變狀態(tài)寄存器(CPSR)內(nèi)的狀態(tài)位,使處理器切換到不同的狀態(tài),然后給SP賦值。這里列出的代碼定義了三種模式的SP指針,其中,I_Bit表示IRQ的中斷禁止位;F_Bit表示FIQ的中斷禁止位:
??? @; Set up SVC stack to be 4K on top of zero-init data
????LDR???r1, =installStack
?? ?ADD?sp, ??r1, #2048
??? @; Set up IRQ and FIQ stacks
?? ?MOV??r0, #(Mode_IRQ32 | I_Bit)
?? ?MSR?cpsr, ?r0
?? ?MOV??r0, r0
?? ?ADD?sp, ??r1, #2048*2
?? ?MOV??r0, #(Mode_FIQ32 | I_Bit | F_Bit)
?? ?MSR?cpsr, ?r0
?? ?MOV??r0, r0
?? ?ADD?sp, ??r1, #2048*3
?? ?一般堆棧的大小要根據(jù)需要而定,但是要盡可能給堆棧分配快速和高帶寬的存儲(chǔ)器。堆棧性能的提高對(duì)系統(tǒng)性能的影響是非常明顯的。
1.6 初始化有特殊要求的端口、設(shè)備
??? 有些關(guān)鍵的I/O部件必須在使能IRQ和FIQ之前進(jìn)行初始化。因?yàn)槿绻谑鼓躀RQ和FIQ之前沒(méi)有進(jìn)行初始化,可能產(chǎn)生假的異常中斷信號(hào)。程序中初始化了HMS30C7202的串口1用來(lái)調(diào)試程序與其它設(shè)備通信。串口1是一個(gè)通用全雙工異步接收/發(fā)送器(UART),它支持16C550的大部分功能。UART有接收緩沖/發(fā)送保持寄存器、波特率除數(shù)鎖存器、中斷允許寄存器等9個(gè)寄存器。對(duì)串口1的初始化主要是對(duì)各寄存器的設(shè)置,其實(shí)現(xiàn)代碼如下所示:
?? ?_outb(ser_base+0x30,1);
?? ?_outw(0x8002301c, 0xffff9f9f)???? ; GPIO PORT A Enable ???????????? Register
?? ?_outw(0x800230A4, 0x6060)?????? ; GPIO PORT A Multi-Function Select-Register
?? ?serial_outb(SERIAL_LCR,0x80);
?? ?serial_outb(SERIAL_DLL,baud_data[cur_baud]);
?? ?serial_outb(SERIAL_DLM,0x0);
?? ?serial_outb(SERIAL_LCR,0x03);
?? ?serial_outb(SERIAL_FCR,0x01);
?? ?serial_outb(SERIAL_IER,0x00);
?? ?serial_outb(SERIAL_MCR,0x03);
1.7 切換處理器模式,開(kāi)中斷
??? 最后轉(zhuǎn)換到應(yīng)用程序運(yùn)行所需的最終模式,一般是User模式。不要過(guò)早切換到User模式進(jìn)行User模式的堆棧設(shè)置。因?yàn)檫M(jìn)入U(xiǎn)ser模式后就不能再操作CPRS回到別的模式了,可能會(huì)對(duì)接下去的程序執(zhí)行造成影響。
??? 這時(shí)才使能異常中斷,通過(guò)清除CPRS寄存器中的中斷禁止位實(shí)現(xiàn)。如果過(guò)早地開(kāi)中斷,在系統(tǒng)初始化之前就觸發(fā)了有效中斷,會(huì)導(dǎo)致系統(tǒng)的死機(jī)。
1.8 呼叫主應(yīng)用程序
??? 當(dāng)所有的系統(tǒng)初始化工作完成后,就需要把程序流程轉(zhuǎn)入主應(yīng)用程序。
2 技術(shù)難點(diǎn)分析
2.1 多種語(yǔ)言的混合編程
??? ARM有兩種匯編指令集" title="指令集">指令集:16位THUMB指令集和32位ARM指令集。使用16位的存儲(chǔ)器可以降低成本,而且16位THUMB指令集整體執(zhí)行速度比ARM 32位指令集快,提高了代碼密度。為了滿足ARM子程序和Thumb子程序互相調(diào)用,必須保證編寫(xiě)的代碼遵循ATPCS。ATPCS規(guī)定了子程序調(diào)用的基本規(guī)則。
??? ARM系統(tǒng)結(jié)構(gòu)也支持C、C++以及匯編語(yǔ)言的混合編程" title="混合編程">混合編程。匯編語(yǔ)言和C/C++語(yǔ)言的混合編程,在一個(gè)追求效率的程序中比較常見(jiàn)。許多人認(rèn)為像BSP這樣底層的程序應(yīng)該用純匯編語(yǔ)言編寫(xiě),其實(shí)不然。用匯編語(yǔ)言編寫(xiě)的程序可讀性不高,而且不宜維護(hù),不便于向其它類(lèi)型的CPU移植,而這些方面卻是C語(yǔ)言程序的優(yōu)勢(shì)。BSP能否用純C語(yǔ)言去寫(xiě)呢?也不行。因?yàn)槟承┎僮魇怯肅實(shí)現(xiàn)不了的,例如操作特殊寄存器的指令、CP15寄存器的指令、中斷使能及堆棧地址的設(shè)定等。在匯編和C/C++之間的函數(shù)調(diào)用時(shí),也要遵循ATPCS的定義,還要注意的是用C語(yǔ)言編寫(xiě)嵌入式程序時(shí),要避免使用不能被固化到ROM中的庫(kù)函數(shù)。
?
??? 混合編程情況下的程序編譯及鏈接后的輸出代碼與沒(méi)有混合編程時(shí)是不同的。所以當(dāng)多個(gè)源文件如果使用了不同的設(shè)置進(jìn)行編譯,相互之間的調(diào)用可能產(chǎn)生兼容性問(wèn)題,對(duì)此一定要加以仔細(xì)考慮。編譯時(shí),要告訴編譯器和鏈接器足夠的信息,一方面,讓編譯器能夠使用正確的指令碼進(jìn)行編譯;另一方面,在不同的狀態(tài)之間發(fā)生函數(shù)調(diào)用時(shí),鏈接器將插入一段鏈接代碼(veneers)來(lái)實(shí)現(xiàn)狀態(tài)轉(zhuǎn)換。
2.2? MMU的實(shí)現(xiàn)過(guò)程
??? 頁(yè)表是實(shí)現(xiàn)MMU的重要手段。頁(yè)表存放在內(nèi)存中,從虛擬地址到物理地址的變換過(guò)程其實(shí)就是查詢頁(yè)表的過(guò)程。大小為1MB的存儲(chǔ)塊通常被稱(chēng)為段,圖2說(shuō)明了如何查表進(jìn)行段式尋址的全過(guò)程:32位的虛擬地址可分為12位的一級(jí)頁(yè)表序號(hào)和20位的段內(nèi)地址偏移。12位的一級(jí)頁(yè)表序號(hào)和CP15寄存器的C2中的18位變換表基址合并成一級(jí)描述符地址查表找出相應(yīng)的一級(jí)描述符;然后,段對(duì)應(yīng)的物理基地址與段內(nèi)地址偏移量合并成為真正的存儲(chǔ)器存取地址即物理地址,讀出相應(yīng)數(shù)據(jù)。
??? 本文介紹的BSP程序已經(jīng)在以HMS30C7202為主芯片的開(kāi)發(fā)系統(tǒng)上運(yùn)行并測(cè)試通過(guò),并且成功地引導(dǎo)了Linux內(nèi)核,文中引用代碼可以直接使用。今后可以在此基礎(chǔ)上添加命令行解釋程序,在引導(dǎo)操作系統(tǒng)前進(jìn)行存儲(chǔ)器的讀寫(xiě)等,擴(kuò)展開(kāi)發(fā)系統(tǒng)的功能。
參考文獻(xiàn)
1 杜春雷.ARM體系結(jié)構(gòu)與編程.北京:清華大學(xué)出版社,2003
2 費(fèi)浙平.基于ARM的嵌入式系統(tǒng)程序開(kāi)發(fā)要點(diǎn)(二).單片機(jī)與嵌入式系統(tǒng)應(yīng)用, 2003;(9)
3 HMS30C7202Datasheet.Hynix Semiconductor Inc.2002