FPGA 芯片整體架構(gòu)如下所示,大體按照時鐘域劃分的,即根據(jù)不同的工藝、器件速度和對應(yīng)的時鐘進行劃分:
FPGA 內(nèi)部詳細架構(gòu)又細分為如下六大模塊:
1、可編程輸入輸出單元(IOB)(Input Output Block)
為了便于管理和適應(yīng)多種電器標準,F(xiàn)PGA 的 IOB 被劃分為若干個組(Bank),每個 Bank 的接口標準由其接口電壓 VCCO 決定,一個 Bank 只能有一種 VCCO,但不同 Bank 的 VCCO 可以不同。只有相同電氣標準和物理特性的端口才能連接在一起,VCCO 電壓相同是接口標準的基本條件。
2、可配置邏輯塊(CLB)(Configurable Logic Block)
FPGA 的基本可編程邏輯單元是 CLB,而一個 CLB 是由查找表、數(shù)據(jù)選擇器、進位鏈、寄存器組成的。查找表和多路選擇器完成組合邏輯功能,寄存器(可配置成觸發(fā)器或鎖存器),完成時序邏輯功能。在賽靈思公司公司的 FPGA 器件中,一個 CLB 由多個(一般為 4 個或 2 個)相同的 Slice 和附加邏輯構(gòu)成。
Slice 又分為 SLICEL(Logic)和 SLICEM(Memory)。SLICEL 和 SLICEM 內(nèi)部都各自包含了 4 個 6 輸入查找表(LUT6)、3 個數(shù)據(jù)選擇器(Mux)、1 個進位鏈(Carry Chain)和 8 個觸發(fā)器(Flip-Flop):
查找表:6 輸入查找表類似于一個容量為 64 bits 的 ROM(26 = 64)(工藝上是珍貴的 SRAM 資源),6 表示地址輸入位寬為 6 bits,存儲的內(nèi)容作為輸入對應(yīng)的輸出結(jié)果的邏輯運算,并在 FPGA 配置時載入。
對于查找表:目前主流 FPGA 都采用了基于 SRAM 工藝的查找表(LUT)(Look Up Table)結(jié)構(gòu)。LUT 本質(zhì)上就是一個 RAM。當(dāng)用戶通過原理圖或 HDL 語言描述了一個邏輯電路以后,F(xiàn)PGA 開發(fā)軟件會自動計算邏輯電路的所有可能結(jié)果,列成一個真值表的形式,并把真值表(即輸入對應(yīng)的輸出邏輯)事先寫入 RAM,這樣,每輸入一個信號進行邏輯運算就等于輸入一個地址進行查表,找出地址對應(yīng)的內(nèi)容,然后輸出即可。目前FPGA中多使用4輸入的LUT,所以每一個LUT可以看成一個有4位地址線的RAM。
數(shù)據(jù)選擇器:數(shù)據(jù)選擇器一般在 FPGA 配置后固定下來。
進位鏈:超前進位加法器,方便加法器的實現(xiàn),加快復(fù)雜加法的運算。
寄存器:可以配置成多種工作方式,比如 FF 或 Latch,同步復(fù)位或異步復(fù)位、復(fù)位高有效或低有效等等。
SLICEM 的結(jié)構(gòu)與 SLICEL 的結(jié)構(gòu)類似,最大的區(qū)別是使用了一個新的單元代替 SLICE 中的查找表。這個新的單元可以配置為 LUT、RAM、ROM 或移位寄存器(SRL16 或 SRL32),從而可以實現(xiàn) LUT 的邏輯功能,也能做存儲單元(多個單元組合起來可以提供更大的容量)和移位寄存器(提供延遲等功能)。
其中 SLICEM 中 LUT 的輸入端都地址和寫地址為 8 位,高兩位可能是將 4 個 LUT 并聯(lián)一起作為一個大的 RAM 或 ROM 時用,同時 SLICEL 和 SLICEM 的 LUT 均可設(shè)為 5 位或 6 位查找表。
3、嵌入式塊 RAM(BRAM)(Block RAM)
塊 RAM 可被配置為 ROM、RAM 以及 FIFO 等常用的存儲模塊。區(qū)別于分布式 RAM(Distributed RAM)(主要由 LUT 組成的,不占用 BRAM 的資源)。分布式 RAM 也可以被配置為 ROM、RAM 以及 FIFO 等常用的存儲模塊,但是性能不如 BRAM,畢竟 BRAM 才是專用的,一般是 BRAM 資源不夠用的情況下才使用分布式 RAM。反之,BRAM 由一定數(shù)量固定大小的存儲塊構(gòu)成的,使用 BRAM 資源不占用額外的邏輯資源,并且速度快,不過使用的時候消耗的 BRAM 資源只能是其塊大小的整數(shù)倍,就算你只存了 1 bit 也要占用一個 BRAM。
一個 BRAM 的大小為 36K Bits,并且分成兩個小的 BRAM 各自為 18K Bits,排列成又分為上下兩塊,上半部分為 RAMB18 下半部分為 RAMBFIFO36。在 FIFO 例化的時候可以將 BRAM 設(shè)置為 FIFO 時,不會使用額外的 CLB 資源,并且這部分 RAM 是真雙口 RAM。
FPGA 所采用的邏輯單元陣列 LCA(Logic Cell Array)內(nèi)部所包括的可配置邏輯模塊 CLB(Configurable Logic Block)、 輸出輸入模塊 IOB(Input Output Block)和內(nèi)部互連線(Interconnect)三個部分。前面兩種已經(jīng)介紹完畢,接下來介紹第三種:
4、互連線資源(Interconnect)
布線資源連通 FPGA 內(nèi)部的所有單元,而連線的長度和工藝決定著信號在連線上的驅(qū)動能力和傳輸速度。FPGA 芯片內(nèi)部有著豐富的布線資源,根據(jù)工藝、長度、寬度和分布位置的不同而劃分為 4 類不同的類別:第一類是全局布線資源,用于芯片內(nèi)部全局時鐘和全局復(fù)位/置位的布線;第二類是長線資源,用于完成芯片 Bank 間的高速信號和第二全局時鐘信號的布線;第三類是短線資源,用于完成基本邏輯單元之間的邏輯互連和布線;第四類是分布式的布線資源,用于專有時鐘、復(fù)位等控制信號線。
5、底層內(nèi)嵌功能單元
內(nèi)嵌功能模塊主要指 DLL(Delay Locked Loop)、PLL(Phase Locked Loop)、DSP(Digital System Processing)(數(shù)字信號處理)、DCM(Digital Clock Manager)(提供數(shù)字時鐘管理和相位環(huán)路鎖定)、和 CPU(Central Processing Unit)等等軟處理核(比如 MicroBlaze 的軟核)?,F(xiàn)在越來越豐富的內(nèi)嵌功能單元,使得單片 FPGA 成為了系統(tǒng)級的設(shè)計工具,使其具備了軟硬件聯(lián)合設(shè)計的能力,逐步向 SoC 平臺過渡。
關(guān)于 DCM:DCM 是 FPGA 內(nèi)部處理時鐘的重要器件,他的作用主要有三個:消除時鐘偏斜(Clock De-Skew)、頻率合成(Frequency Synthesis)和相位調(diào)整(Phase ShifTIng)。
DCM 的核心器件是數(shù)字鎖相環(huán)(DLL,Delay Locked Loop)。它是由一串固定時延的延時器組成,每一個延時器的時延為 30 皮秒,也就是說,DCM 所進行的倍頻、分頻、調(diào)相的精度為 30 皮秒。
對于時鐘,我們最好不要將兩個時鐘通過一個與門或者或門(邏輯操作),這樣的話就很可能會產(chǎn)生毛刺,影響系統(tǒng)穩(wěn)定性,如果要對時鐘進行操作,例如切換時鐘等,請使用 FPGA 內(nèi)部的專用器件“BUFGMUX”。
6、內(nèi)嵌專用硬核
內(nèi)嵌專用硬核是相對底層嵌入的軟核而言的,指 FPGA 處理能力強大的硬核(比如 ARM Cortex-A9 的硬核),等效于 ASIC 電路。為了提高 FPGA 性能,芯片生產(chǎn)商在芯片內(nèi)部集成了一些專用的硬核。例如為了提高 FPGA 的乘法速度,主流的 FPGA 中都集成了專用乘法器,而為了適用通信總線與接口標準,很多高端的 FPGA 內(nèi)部都集成了串并收發(fā)器(Serdes),可以達到數(shù)十 Gbps 的收發(fā)速度(比如 FMC)。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<