??? 摘 要:? 在介紹基于ARM體系的嵌入式" title="的嵌入式">的嵌入式系統(tǒng)啟動流程的基礎上,結合編程實例,詳細、系統(tǒng)地敘述了BSP(板級支持包)程序的各個組成部分及其具體設計方法,并就實際程序設計中的幾個難點問題做了說明。
??? 關鍵詞:? ARM? BSP? 嵌入式系統(tǒng)? 微處理器
?
??? ARM公司在32位RISC的CPU開發(fā)領域不斷取得突破,其結構已經(jīng)從V3發(fā)展到V6。
??? BSP(Board Support Package)板級支持包介于主板硬件和操作系統(tǒng)之間,其功能與PC機上的BIOS相類似,主要完成硬件初始化并切換到相應的操作系統(tǒng)。BSP是相對于操作系統(tǒng)而言的,不同的操作系統(tǒng)對應于不同定義形式的BSP,例如VxWorks的BSP和Linux的BSP相對于某一CPU來說,盡管實現(xiàn)的功能一樣,可是寫法和接口定義是完全不同的。另外,仔細研究所用的芯片資料也十分重要,例如盡管ARM在內核上兼容,但每家芯片都有自己的特色。所以這就要求BSP程序員對硬件、軟件和操作系統(tǒng)都要有一定的了解。
??? 本文介紹基于ARM體系的嵌入式應用系統(tǒng)初始化部分BSP的程序設計。本文引用的源碼全部是基于HMS30C7202芯片設計,并已成功運行。
1 初始化過程
??? 盡管各種嵌入式應用系統(tǒng)的結構及功能差別很大,但其系統(tǒng)初始化部分完成的操作有很大一部分是相似的。嵌入式系統(tǒng)的啟動流程如圖1所示。
?
1.1 設置入口指針
??? 啟動程序首先必須定義入口指針,而且整個應用程序" title="應用程序">應用程序只有一個入口指針。一般地,程序在編譯鏈接時將異常中斷向量表" title="向量表">向量表鏈接在0地址處,并且作為整個程序的入口點。入口點代碼如下:
??? ENTRY(_start)???????? ;開始
1.2 設置異常中斷向量表
??? ARM要求中斷向量表必須放置在從0開始、連續(xù)8×4字節(jié)的空間內。各異常中斷向量地址以及中斷的處理優(yōu)先級如表1:
?
??? 每當一個中斷發(fā)生后,ARM處理器便強制把程序計數(shù)器(PC)指針置為向量表中對應中斷類型的地址值。因為每個中斷向量僅占據(jù)放置1條ARM指令的空間,所以通常放置1條跳轉指令或向程序計數(shù)器(PC)寄存器賦值的數(shù)據(jù)訪問指令,使程序跳轉到相應的異常中斷處理程序執(zhí)行。如果異常中斷處理程序起始地址小于32MB,使用B跳轉指令;如果跳轉范圍大于32MB,使用LDR指令。
??? 另外,對于各未用中斷,可使其指向一個只含返回指令的啞函數(shù),以防止錯誤中斷引起系統(tǒng)的混亂。
1.3 初始化存儲系統(tǒng)
??? 初始化存儲系統(tǒng)的編程對象是系統(tǒng)的存儲器控制器,一個系統(tǒng)可能存在多種存儲器類型的接口,不同的存儲系統(tǒng)的設計不盡相同。Flash和SRAM同屬于靜態(tài)存儲器類型,可以合用一個存儲器端口;而DRAM因為有動態(tài)刷新和地址線復用等特性,通常配有專用的存儲器端口。其中,SDRAM必須在初始化階段進行設置,因為大部分的程序代碼和數(shù)據(jù)都要在SDRAM中運行。
??? 在HMS30C7202中,與SDRAM配置有關的寄存器有4個:配置寄存器、刷新定時寄存器、寫緩沖寫回寄存器和等待驅動寄存器,需要根據(jù)實際的系統(tǒng)設計對此分別加以正確配置。
??? SDRAM的初始化過程如下:加電→延遲10ms(各具體SDRAM器件延時時間可能不同)→設置配置寄存器參數(shù)→延時→寫刷新定時寄存器,設置刷新周期→延時→使能自動刷新→延時→設置模式寄存器(位于SDRAM內部)。
1.4 存儲器地址分布重映射(remap)和MMU
??? 系統(tǒng)一上電,程序將自動從0地址處開始執(zhí)行。因此,必須保證在0地址處存在正確的代碼,即要求0地址開始處是非易失性的ROM或Flash等。但是因為ROM或Flash的訪問速度相對較慢,每次中斷響應發(fā)生后,都要從讀取ROM或Flash上面的向量表開始,影響了中斷響應速度。一般程序執(zhí)行后將SDRAM映射為地址0,并把系統(tǒng)程序加載到SDRAM中運行,其具體步驟可以采用以下的方案:
??? (1)上電后,從0地址的ROM開始往下執(zhí)行;
??? (2)根據(jù)映射前的地址,對SDRAM進行必要的代碼和數(shù)據(jù)拷貝;
??? (3)拷貝完成后,進行重映射操作;
??? (4)因為RAM在重映射前準備好了內容,使得PC指針能繼續(xù)在RAM里取得正確的指令。
??? 在這種地址映射的變化過程中,程序員需要仔細考慮的是:程序的執(zhí)行流程不能被這種變化所打斷,注意保證程序執(zhí)行流程在重映射前后的承接關系。
??? 存儲器的地址分配是很靈活的,可以將I/O操作映射成內存操作,也可以通過映射對某些不可訪問的地址空間進行保護等。進行存儲器初始化設計時,一定要根據(jù)應用程序的具體要求來完成地址分配。對地址管理通過MMU即存儲器管理單元實現(xiàn)。
??? 在ARM系統(tǒng)中,MMU通過頁式虛擬存儲管理,將虛擬空間和物理空間分別分成一個個固定大小的頁,并建立兩者之間的映射關系,從而實現(xiàn)虛擬地址到物理地址的轉換。MMU還可完成存儲器訪問權限的控制和虛擬存儲器空間緩沖特性的設置。
??? 以下是實現(xiàn)MMU的部分代碼:
??? for(i=1; i<0x1000; i++) {
??? ??pagetable[i] = (i<<20) | MMU_SECDESC;
??? ?}???? ?//建立頁表,每頁大小為1MB,頁表偏移序號是物理地址的高12位;
??? ??for(addr=SDRAM_BASE; addr < (SDRAM_BASE+SDRAM_SIZE/2); addr += SIZE_1M)
??? ??pagetable[addr >> 20] = addr | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將SDRAM_BASE至(SDRAM_BASE+SDRAM_SIZE/2)空間的設置為不可CACHE和不可BUFFER的
???? ?for(addr=SDRAM_BASE+SDRAM_SIZE/2; addr< (SDRAM_BASE+SDRAM_SIZE); addr += SIZE_1M)
????? pagetable[addr >> 20] = (addr+0x1000000) | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將這段空間的地址映射關系設置為VA(虛擬地址)=PA(物理地址)+0x1000000
??? ??pagetable[0] = (0x42f00000) | MMU_SECDESC | MMU_CACHEABLE | MMU_BUFFERABLE;//將SDRAM的虛擬地址0x42f00000映射到0處
1.5 初始化各模式下的堆棧指針
??? 因為ARM處理器有7種執(zhí)行狀態(tài),每一種狀態(tài)的堆棧指針寄存器(SP)都是獨立的(System和User模式使用相同SP寄存器)。因此,對程序中需要用到的每一種模式都要給SP寄存器定義一個堆棧地址。方法是改變狀態(tài)寄存器(CPSR)內的狀態(tài)位,使處理器切換到不同的狀態(tài),然后給SP賦值。這里列出的代碼定義了三種模式的SP指針,其中,I_Bit表示IRQ的中斷禁止位;F_Bit表示FIQ的中斷禁止位:
??? @; Set up SVC stack to be 4K on top of zero-init data
????LDR???r1, =installStack
?? ?ADD?sp, ??r1, #2048
??? @; Set up IRQ and FIQ stacks
?? ?MOV??r0, #(Mode_IRQ32 | I_Bit)
?? ?MSR?cpsr, ?r0
?? ?MOV??r0, r0
?? ?ADD?sp, ??r1, #2048*2
?? ?MOV??r0, #(Mode_FIQ32 | I_Bit | F_Bit)
?? ?MSR?cpsr, ?r0
?? ?MOV??r0, r0
?? ?ADD?sp, ??r1, #2048*3
?? ?一般堆棧的大小要根據(jù)需要而定,但是要盡可能給堆棧分配快速和高帶寬的存儲器。堆棧性能的提高對系統(tǒng)性能的影響是非常明顯的。
1.6 初始化有特殊要求的端口、設備
??? 有些關鍵的I/O部件必須在使能IRQ和FIQ之前進行初始化。因為如果在使能IRQ和FIQ之前沒有進行初始化,可能產(chǎn)生假的異常中斷信號。程序中初始化了HMS30C7202的串口1用來調試程序與其它設備通信。串口1是一個通用全雙工異步接收/發(fā)送器(UART),它支持16C550的大部分功能。UART有接收緩沖/發(fā)送保持寄存器、波特率除數(shù)鎖存器、中斷允許寄存器等9個寄存器。對串口1的初始化主要是對各寄存器的設置,其實現(xiàn)代碼如下所示:
?? ?_outb(ser_base+0x30,1);
?? ?_outw(0x8002301c, 0xffff9f9f)???? ; GPIO PORT A Enable ???????????? Register
?? ?_outw(0x800230A4, 0x6060)?????? ; GPIO PORT A Multi-Function Select-Register
?? ?serial_outb(SERIAL_LCR,0x80);
?? ?serial_outb(SERIAL_DLL,baud_data[cur_baud]);
?? ?serial_outb(SERIAL_DLM,0x0);
?? ?serial_outb(SERIAL_LCR,0x03);
?? ?serial_outb(SERIAL_FCR,0x01);
?? ?serial_outb(SERIAL_IER,0x00);
?? ?serial_outb(SERIAL_MCR,0x03);
1.7 切換處理器模式,開中斷
??? 最后轉換到應用程序運行所需的最終模式,一般是User模式。不要過早切換到User模式進行User模式的堆棧設置。因為進入User模式后就不能再操作CPRS回到別的模式了,可能會對接下去的程序執(zhí)行造成影響。
??? 這時才使能異常中斷,通過清除CPRS寄存器中的中斷禁止位實現(xiàn)。如果過早地開中斷,在系統(tǒng)初始化之前就觸發(fā)了有效中斷,會導致系統(tǒng)的死機。
1.8 呼叫主應用程序
??? 當所有的系統(tǒng)初始化工作完成后,就需要把程序流程轉入主應用程序。
2 技術難點分析
2.1 多種語言的混合編程
??? ARM有兩種匯編指令集" title="指令集">指令集:16位THUMB指令集和32位ARM指令集。使用16位的存儲器可以降低成本,而且16位THUMB指令集整體執(zhí)行速度比ARM 32位指令集快,提高了代碼密度。為了滿足ARM子程序和Thumb子程序互相調用,必須保證編寫的代碼遵循ATPCS。ATPCS規(guī)定了子程序調用的基本規(guī)則。
??? ARM系統(tǒng)結構也支持C、C++以及匯編語言的混合編程" title="混合編程">混合編程。匯編語言和C/C++語言的混合編程,在一個追求效率的程序中比較常見。許多人認為像BSP這樣底層的程序應該用純匯編語言編寫,其實不然。用匯編語言編寫的程序可讀性不高,而且不宜維護,不便于向其它類型的CPU移植,而這些方面卻是C語言程序的優(yōu)勢。BSP能否用純C語言去寫呢?也不行。因為某些操作是用C實現(xiàn)不了的,例如操作特殊寄存器的指令、CP15寄存器的指令、中斷使能及堆棧地址的設定等。在匯編和C/C++之間的函數(shù)調用時,也要遵循ATPCS的定義,還要注意的是用C語言編寫嵌入式程序時,要避免使用不能被固化到ROM中的庫函數(shù)。
?
??? 混合編程情況下的程序編譯及鏈接后的輸出代碼與沒有混合編程時是不同的。所以當多個源文件如果使用了不同的設置進行編譯,相互之間的調用可能產(chǎn)生兼容性問題,對此一定要加以仔細考慮。編譯時,要告訴編譯器和鏈接器足夠的信息,一方面,讓編譯器能夠使用正確的指令碼進行編譯;另一方面,在不同的狀態(tài)之間發(fā)生函數(shù)調用時,鏈接器將插入一段鏈接代碼(veneers)來實現(xiàn)狀態(tài)轉換。
2.2? MMU的實現(xiàn)過程
??? 頁表是實現(xiàn)MMU的重要手段。頁表存放在內存中,從虛擬地址到物理地址的變換過程其實就是查詢頁表的過程。大小為1MB的存儲塊通常被稱為段,圖2說明了如何查表進行段式尋址的全過程:32位的虛擬地址可分為12位的一級頁表序號和20位的段內地址偏移。12位的一級頁表序號和CP15寄存器的C2中的18位變換表基址合并成一級描述符地址查表找出相應的一級描述符;然后,段對應的物理基地址與段內地址偏移量合并成為真正的存儲器存取地址即物理地址,讀出相應數(shù)據(jù)。
??? 本文介紹的BSP程序已經(jīng)在以HMS30C7202為主芯片的開發(fā)系統(tǒng)上運行并測試通過,并且成功地引導了Linux內核,文中引用代碼可以直接使用。今后可以在此基礎上添加命令行解釋程序,在引導操作系統(tǒng)前進行存儲器的讀寫等,擴展開發(fā)系統(tǒng)的功能。
參考文獻
1 杜春雷.ARM體系結構與編程.北京:清華大學出版社,2003
2 費浙平.基于ARM的嵌入式系統(tǒng)程序開發(fā)要點(二).單片機與嵌入式系統(tǒng)應用, 2003;(9)
3 HMS30C7202Datasheet.Hynix Semiconductor Inc.2002