摘要:通過分析920T核ARM 處理器的高速片上系統(tǒng)總線AHB時序及其靜態(tài)存儲控制器SMC接口模型,研究IBM PC/AT和IEEE PC/104總線規(guī)范,提出一種在ARM 平臺上實現(xiàn)兼容PC/104總線的方案.深入探討兩種平臺體系在存儲器結構、指令系統(tǒng)及總線時序等方面的巨大差異,給出了克服這些差異并實現(xiàn)總線功能兼容的方法.該兼容總線解決了在ARM 平臺上無法使用標準PC/104模板的難題,采用該方案有利于在嵌入式系統(tǒng)的設計中兼取ARM 處理器和PC/AT體系的優(yōu)勢.
引 言
PC/104 是一種專門為嵌入式應用而定義的工業(yè)控制總線規(guī)范.以IBM PC/AT總線規(guī)范為基礎的個人計算機及其外圍設備在應用上取得了巨大的成就,IEEE一996稱之為ISA(工業(yè)標準架構:Industry Standard Architecture)總線.PC/104是ISA標準的延伸,定義在IEEE-P996.1中,稱為兼容PC嵌入式模塊標準.PC/104實質(zhì)上是一種緊湊型的ISA,其信號定義和Pc/AT基本一致,但電氣和機械規(guī)范卻完全不同,是一種優(yōu)化、小型、堆疊式結構的嵌入式總線系統(tǒng).PC/104總線來自于實踐發(fā)展的需要,同時得益于PC技術的迅速發(fā)展,由于其開發(fā)環(huán)境友好、兼容芯片豐富、標準支持廣泛等優(yōu)勢,受到了眾多從事嵌入式產(chǎn)品生產(chǎn)商和系統(tǒng)集成商的歡迎,盡管現(xiàn)在ISA設備已不常見,但PC/104在嵌入式系統(tǒng)領域卻仍是通行的標準.
ARM是當前嵌入式系統(tǒng)應用中的熱門技術.由于ARM處理器的卓越性能、較低的價格以及業(yè)內(nèi)半導體廠商的廣泛支持,在嵌入式環(huán)境中有廣泛的應用.ARM 公司創(chuàng)造了CHIPLESS模式,該公司通過將高效的ARM 內(nèi)核授權給半導體公司,由半導體公司根據(jù)實際的應用情況加上各種外圍的功能電路來構成一塊完整的芯片,這種模式使半導體廠商得以有能力生產(chǎn)功能強大的各種專用處理器芯片.AR M在設計上基于SoC思想,優(yōu)先考慮對每一個具體應用使用最大可能集成周邊設備的單一芯片,但在板極擴展方面仍然缺乏能被廣泛接受的新工業(yè)標準.
1 PC/AT模型和PC/104總線
1.1 總線信號
PC/104_4 ]是一種16位總線,但可向前兼容8位XT模式,典型總線時鐘為8 MHz,4個時鐘脈沖可完成一次完整的總線訪問,必要時可插入一個額外的等待周期以適應低速外設.在嵌入式系統(tǒng)開發(fā)中常用以下信號.
1.1.1 地址和數(shù)據(jù)信號線
BALE總線地址鎖存使能信號線,由平臺CPU驅(qū)動.當ISA擴展卡或DMA控制器占用總線時,它也被置為邏輯1.
SA~19:O>:低2O根地址信號線,由當前總線的擁用者驅(qū)動.
LAd 23:17> :鎖存地址信號線,用來訪問16MB的存儲器地址空間.由當前總線擁有者或DMA控制器驅(qū)動.
SD<15:0> :數(shù)據(jù)信號線.
1.1.2 總線周期控制信號線
MEMR#:存儲器讀信號線.
MEMW #:存儲器寫信號線.
IOR#:I/O I/O讀信號線.
IOW #:I/O I/O寫信號線.
1.1.3 中斷和DMA(Direct Memory Access)信號線
IRQx:中斷請求信號線.
DRQx:DMA請求信號線.
DACKx#:DMA應答信號線.
1.2 地址空間
PC/AT系統(tǒng)使用不同的指令訪問存儲器空間和IO端I:1空間,訪問存儲器空間時PC/104總線驅(qū)動MEMR#和MEMW#信號,訪問存儲器空間時PC/104總線驅(qū)動IOR#和IOW #信號.兩個空間使用同一套地址線,但是由于端口空間只有64K有效,所以進行IO 端口訪問時地址線上只有SA<15:O>是有效的.
PC/AT系統(tǒng)有專門的端口訪問指令用于實現(xiàn)端口訪問,Linux用戶程序只需以root權限調(diào)用ioperm()指定需操作的端口地址范圍,之后即可自由訪問這些端口.由于用于訪問端口的一組宏實際上直接對應CPU的端口訪問指令,所以存取效率很高.
1.3 PC/104總線周期
PC/104總線周期分為CPU驅(qū)動和DMA控制器驅(qū)動兩大類,在嵌入式應用中較常用的是CPU驅(qū)動的IO讀/IO寫周期.
圖1中采用8 MHz時鐘的標準PC/104總線£Rd大于300 ns,tAF應大于250 ns,tRDpw約為500 ns。
2 EP9315(ARM920T)體系
2.1 存儲器結構和地址空間
EP9315是Cirrus Logic公司生產(chǎn)的典型ARM 920 TDM I(Thumb,Debug,M ultiply,Em—bedded ICE macrocel1)32位哈佛結構處理器.EP9315有一個通用存儲器訪問接口,支持SDRAM,SRAM,ROM,及FLASH(包括N0R FLASH)等不同形式的存儲器,各種存儲器訪問均共享數(shù)據(jù)總線DA[3l:O]和地址總線AD[Z5:o],使用統(tǒng)一的訪問控制邏輯 。
與X86模型不同,ARM 平臺只實現(xiàn)一個物理地址空間,在Bo0T成功后只擁有一個唯一的虛地址空間,CPU不設立專門的外設I/O指令,訪問外設I/O端口和內(nèi)存單元使用相同的指令.
引腳CSn[7:6]和CSn[3:O]用于存儲器芯片的選通,除發(fā)生時間略有差異之外(圖2),基本上可視為地址總線的高位線.
2.2 AHB總線時序和SRAM 接口
AHB(Advanced High-Speed Bus)是EP93 1 5內(nèi)部920T核與存儲器、DMA,存儲器等設備實現(xiàn)高速互聯(lián)的系統(tǒng)總線.EP9315的AHB具有完善的多主控沖突仲裁能力,其典型工作頻率可達100 MH。
靜態(tài)存儲控制器SMC(Static Memory Controller)與920T核心通過AHB互聯(lián),支持存儲器的8/16/32位訪問方式.SMC最多可提供8個組,每個組均可支持SRAM,ROM,F(xiàn)LASH EPROM 等存儲器的訪問,各組可以對數(shù)據(jù)總線寬度和速度等參數(shù)獨立配置.圖2描述了SRAM 讀操作時序.
圖中f刪為CSn到RDn的延遲,最大值為3 ns;tDAs是RDn無效前的數(shù)據(jù)總線建立時間,最小值為12+tHcI tRDD 是RDn有效時間,典型值為t HcI K×(W ST1+ 2)。
HCLK是AHB總線的工作頻率,該頻率的高低直接影響系統(tǒng)全局性能,因此通常配置為上限100 MHz,此時相應周期£脅 為10 ns.WSTI用于控制sMc對SRAM/R0M 的訪問速度,寄存器SMCBCR0—3, SMCBCR6-7 (地址0x80080000—0x8008001C)的第5-9位分別為相應各組的WST1.WST1的默認值為0xlF,即默認情況下SMC使用
最低的訪問速度,顯然fRDD 為330 ns,小于PC/104總線中的500 ns(圖1).
3 PC/104總線實現(xiàn)
3.1 總線驅(qū)動
在EP9315支持的各類總線接口邏輯中,SMC提供的SRAM/ROM 時序與PC/104總線最為接近.將外部設備所需的PC端口空間和存儲器空間均映射至統(tǒng)一的虛擬空間中即可實現(xiàn)訪問.
注意到PC/104總線使用標準TTL邏輯電平,而EP9315的處理器是3.3 V器件,在極端負載情況下無法保證系統(tǒng)穩(wěn)定工作.TI的雙電源總線收發(fā)器1T45,2T45,16T245等可用于實現(xiàn)電平轉(zhuǎn)換,圖3是1T45的引腳邏輯圖.
地址總線及訪問控制信號均由CPU驅(qū)動,外部設備始終處于被動接收狀態(tài),正確設定數(shù)據(jù)流向即可.
數(shù)據(jù)總線信號是時分雙向傳輸?shù)?,為遍免出現(xiàn)總線沖突,必須保證除非CPU 透過該收發(fā)器對外設進行讀訪問,否則收發(fā)器的CPU 側(cè)應始終處于高阻狀態(tài).為此,16T245等具有輸出使能端的器件只需使輸出無效即可,而對于無使能端的收發(fā)器則應使CPU側(cè)處于輸入狀態(tài)(高阻).
確認CPU 已向兼容PC/104總線發(fā)起讀操作的有效方法是檢查RDn的下降沿是否發(fā)生.一旦RDn下降,應立即將收發(fā)器置成從外設流向CPU方向,且輸出使能有效,并至少保持至RDn上升沿之后,以保證可靠讀?。?/p>
3.2 端口映射
SMC的存儲器分組片選信號CSn可作為高位地址線參加這址譯碼.任取CSi和CSj組用于兼容總線,即可分別實現(xiàn)O-0x3FFFFFF的獨立存儲器地址和IO端口地址.可用地址數(shù)量已經(jīng)遠超出XT系統(tǒng)中的1 M(存儲器)和1 K(IO端口).
在Linux系統(tǒng)中,io.h文件中聲明了函數(shù)iore—map(),用于將兼容總線上外部資源的物理地址映射到核心虛地址空間中.iounmap()函數(shù)用于取消ioremap()所做的映射.上述操作都應在設備驅(qū)動程序中執(zhí)行.在外部資源成功映射到核心虛地址后,使用指向核心虛地址的指針就可訪問相應設備資源,但顯然這種訪問方式與在X86平臺下差異較大.
將兼容總線視為一個獨立的字符設備,為其編寫驅(qū)動程序,實現(xiàn)對指定偏移地址的讀寫函數(shù),此處的偏移地址即對應PC/104總線中的物理地址 .
對inb(),outb()等X86平臺下的常見的底層端口操作函數(shù),可用宏替換的方式轉(zhuǎn)由驅(qū)動中的相應讀寫函數(shù)實現(xiàn).
3.3 總線時序控制
綜合前文所述,盡管SMC的SRAM 訪問時序非常接近PC/lO4總線,但是要實現(xiàn)高兼容性的PC/lO4,仍有兩方面問題需要解決,一是SMC驅(qū)動的SRAM 讀寫速度遠高于PC/104總線,二是為解決電平兼容問題引入的總線收發(fā)器,其數(shù)據(jù)流向和輸出使能需要適當?shù)目刂疲?/p>
以下VHDL代碼根據(jù)SMC輸出的RDn和WRn設置EIOR和EIOW 時序,并適時輸出信號EXIDR,EXOE控制收發(fā)器數(shù)據(jù)流向和輸出使能.
ECLK是頻率為27 MHz是時鐘脈沖.
If ECLK’EVENT and ECLK一‘1’then
if(? )then __地址無效
EXoE< 一:1’;
EXDlR< 一‘1’;
EIOR< 一‘1’;
rdreg< 一0;
else
if rdreg< 1 l then
rdreg< 一rdreg+ 1;
EXOE< 一‘0’;
else
rdreg< 一0;
EXDIR< 一‘1’;
EXoE< 一‘1’;
end if;
if rdreg< 2 or rdreg> 6 then
EIOR< 一‘1’;
EIOW < 一‘1’;
elsif rdreg一2 or rdreg= 3 then
if RDn一‘1’then
EIOR< 一‘1’;
EXDIR< 一‘1’;
elsif W Rn一‘1’then
EIOW < 一‘0’;
EXDIR< 一‘1’;
end if;
end if;
上述代碼適當延遲了關閉雙電源收發(fā)器的輸出使能和數(shù)據(jù)流向重設時間,保證數(shù)據(jù)總線穩(wěn)定,使CPU 和外設有足夠的時間進行輸入輸出操作.
圖4中曲線2是兼容PC/104地址空間內(nèi)任意地址信號經(jīng)收發(fā)器緩沖后的譯碼結果,曲線1和曲線3是對該地址進行讀操作時的RDn和IOR信號.
圖4中RDn由EP9315直接驅(qū)動,原始邏輯電平為3.3 V,實驗電路對該信號電平進行了無時延的處理.
目前主流元器件在速度上都已能兼容PCI總線,因此盡管SMC驅(qū)動的SRAM 讀寫速度高于標準PC/104總線,但只要保證各控制信號問關系清晰(圖4b),是不會造成總線訪問失敗的.
4 結束語
利用ARM 系統(tǒng)成本較低,功耗更小,啟動速度快,指令效率高的的特點,兼取PC/AT系統(tǒng)和PC/104總線設備在產(chǎn)業(yè)化基礎方面的優(yōu)勢,在ARM平臺上構建PC/104總線,有助于利用現(xiàn)有資源,保護已有投資.由于ARM 與PC/AT模型在處理器架構上有本質(zhì)性的差異,在ARM 平臺上構建的PC/104總線在所有的具體應用中要做到與標準PC/104規(guī)范完全兼容幾乎是不可能,但是在特定的應用需求及確定的操作系統(tǒng)下這種努力是完全可行并且有效的。對于特定的應用而言,通常只需顧及PC/104總線時序的一個子集,這就大大降低了系統(tǒng)現(xiàn)實的難度。兼容PC/104總線在使用遵守ISAPnP(Plug and Play)規(guī)范的設備時有較多的困難。另外在使用包含中斷請求和DMA需求的設備時也需要專門的考慮。