DSP 可以追溯到數(shù)字時(shí)代的開端,甚至可能更早一些。如果說 1946 年第一臺(tái)數(shù)字計(jì)算機(jī) ENIAC 的建造標(biāo)志著 1946 年數(shù)字時(shí)代的開始,那么 DSP 則在兩年后出現(xiàn)。
IEEE 于 1998 年出版了一本名為《Fifty Years of Signal Processing: The IEEE Signal Processing Society and its Technologies 1948-1998》的專著,將 DSP開始的時(shí)代1948年稱為 DSP annus mirabilis。同年,貝爾電話實(shí)驗(yàn)室的 Claude Shannon 發(fā)表了題為“A Mathematical Theory of Communication”的具有里程碑意義的論文,該論文將可實(shí)現(xiàn)的比特率、信道帶寬和信噪比之間的關(guān)系刻在石頭上。
同一年,貝爾實(shí)驗(yàn)室的 Shannon、Bernard M. Oliver 和 John R. Pierce 發(fā)表了“The Philosophy of PCM”,記錄了脈沖編碼調(diào)制的實(shí)用性,并在 PCM 上打上了實(shí)用性的烙印,這個(gè)理論的首次設(shè)想是由Alec Reeves于 1937 年撰寫。(伯納德·奧利弗(Bernard Oliver)在更廣的圈子中可能更為人所知的是巴尼·奧利弗(Barney Oliver),他是 1966 年創(chuàng)立惠普實(shí)驗(yàn)室的杰出人物,但那完全是另一回事。) Shannon、Bernard M. Oliver 和 John R. Pierce 正在記錄一些 PCM用于構(gòu)建絕密 SIGSALY 安全語音系統(tǒng)的概念,這是一個(gè)房間大小、重 50 噸的龐然大物,為二戰(zhàn)期間盟軍最重要的語音通信進(jìn)行編碼和加密。
巧合的是,貝爾實(shí)驗(yàn)室于 1948 年 6 月 30 日宣布開發(fā)晶體管,同年發(fā)表了兩篇引發(fā) DSP 革命的里程碑式論文。(晶體管的實(shí)際發(fā)展發(fā)生在前一年。)我們需要晶體管和固態(tài)電子設(shè)備將Shannon, Oliver和Pierce發(fā)表的論文中的概念轉(zhuǎn)化為價(jià)格低廉的實(shí)用技術(shù),以改變電子產(chǎn)品的世界,所以 1948 年確實(shí)是 DSP 的奇跡年。
1948 年之后,很長(zhǎng)一段時(shí)間內(nèi) DSP 技術(shù)都沒有發(fā)生太多變化。數(shù)字電子技術(shù)對(duì)于 DSP 來說太新了,無法實(shí)用,至少不能用于實(shí)時(shí)信號(hào)處理。在此期間,許多 DSP 涉及將數(shù)字手動(dòng)輸入 Friedan 和 Marchant 機(jī)械計(jì)算器,這對(duì)于音頻或視頻通信來說非常不切實(shí)際。DSP 的萌芽世界等待著關(guān)鍵的發(fā)展。實(shí)際上,有幾個(gè)關(guān)鍵的發(fā)展。
這是 DSP 和單芯片 DSP 如何接管整個(gè)信號(hào)處理世界的故事。它與數(shù)字電子本身的歷史相似,跨越了集成電路 (IC)、微處理器、DSP 和 FPGA 的發(fā)展。在我們看來,F(xiàn)PGA 最終大獲全勝。
一些不穩(wěn)定的步驟
使 DSP 實(shí)用化所需的第一個(gè)關(guān)鍵發(fā)展是 IC 的發(fā)明。幾乎同時(shí),德州儀器 (TI) 的 Jack Kilby 和仙童半導(dǎo)體的 Robert Noyce 設(shè)想了兩種截然不同的方法來構(gòu)建第一個(gè)集成電路。1959 年 2 月,TI 的 Kilby 首先申請(qǐng)了專利。Kilby 曾設(shè)想在一根硅棒上構(gòu)建多個(gè)電子元件,然后使用小的金鍵合線將它們連接在一起。在申請(qǐng)專利之前,他實(shí)際上確實(shí)在 1958 年建造了這樣的電路。然而,Kilby 錯(cuò)綜復(fù)雜的手工組裝過程是完全不切實(shí)際的,而且不太可能擴(kuò)大到商業(yè)批量生產(chǎn)。
Noyce于 1959 年初提出的想法是使用光刻技術(shù),仙童半導(dǎo)體已經(jīng)使用這種技術(shù)制造硅晶體管,在一個(gè)芯片上對(duì)多個(gè)電子元件進(jìn)行成像,然后使用相同的光刻技術(shù)將這些元件與金屬互連層互連。他將細(xì)節(jié)留給 Jean Hoerni,后者開發(fā)了自那時(shí)以來一直用于制造 IC 的平面工藝。Noyce 和 Fairchild 比 Kilby 晚,但仍是在 1959 年就這些想法申請(qǐng)了專利。
用于制造 IC 的實(shí)用制造方法只是所需的許多關(guān)鍵發(fā)展中的第一個(gè)。早期的數(shù)字 IC 太原始,并且包含的晶體管太少,無法認(rèn)真考慮將它們用于實(shí)際的 DSP。那是因?yàn)?DSP 涉及一個(gè)非常深?yuàn)W的概念——稱為數(shù)學(xué)。特別是,您需要兩個(gè)關(guān)鍵的數(shù)學(xué)運(yùn)算符——乘法和加法——并且您需要使用大量這些運(yùn)算來執(zhí)行 DSP。我們中的一些人成為了數(shù)字工程師,所以我們可以忘記數(shù)學(xué)。
DSP 工程并非如此。使用 DSP 時(shí),無法逃避數(shù)學(xué)運(yùn)算。
當(dāng)電子世界正在等待足夠的半導(dǎo)體技術(shù)進(jìn)步使 DSP 成為一種實(shí)用技術(shù)時(shí),世界其他地方已經(jīng)迫不及待了。Bell System 需要開發(fā)方法來通過其龐大的線路安裝基礎(chǔ)來填充更多語音容量,而 PCM 顯然是第一步。此外,二戰(zhàn)后軍隊(duì)對(duì)雷達(dá)和聲納的使用蓬勃發(fā)展,DSP 顯然是改進(jìn)和提高這些系統(tǒng)能力的途徑。通信衛(wèi)星最初是在 1945 年由 Arthur C. Clarke 撰寫的一篇論文中設(shè)想的,它將需要數(shù)字通信來解決一些可怕的信噪比問題,這些問題涉及向地球軌道發(fā)送信號(hào)和從地球軌道接收信號(hào)。
世界已準(zhǔn)備就緒,但 IC 尚未準(zhǔn)備就緒。
當(dāng) DSP 世界等待半導(dǎo)體技術(shù)迎頭趕上時(shí),信號(hào)處理理論家卻沒有。貝爾實(shí)驗(yàn)室的 Binshu Atal 和 Manfred Schroeder 于 1967 年開發(fā)了自適應(yīng)預(yù)測(cè)編碼 (Adaptive Predictive Coding:APC),這使得從 4.8kbps 比特流中獲得適度的音頻成為可能。
然后,Atal 開發(fā)了用于語音壓縮的線性預(yù)測(cè)編碼 (Linear Predictive Coding:LPC)。幾乎同時(shí),名古屋大學(xué)的 Fumitada Imakura 和 NTT 的 Shuzo Saito 開發(fā)了偏相關(guān)(partial correlation:PARCOR)編碼,這是一種非常相似的算法。這些新的語音處理算法自然需要更多的計(jì)算——更多的乘法和加法——這使得需要專門的 IC 來使 DSP 實(shí)用且具有成本效益變得越來越明顯。
但是,通過帶寬受限的電話信道運(yùn)行的語音并不是唯一需要 DSP 信號(hào)的地方。雷達(dá)和聲納信號(hào)處理算法也需要它。真正占用帶寬的電視信號(hào)需要它。只要技術(shù)實(shí)用,生成和接收的每個(gè)信號(hào)都可以從 DSP 中受益。如果它不需要裝滿 TI 和許多其他供應(yīng)商在 1960 年代銷售的中型 IC 的機(jī)架和電路板機(jī)架就好了。
英特爾于 1971 年推出的第一個(gè)商用微處理器 4004 是對(duì)即將到來的事物的第一個(gè)暗示。Intel 4004微處理器當(dāng)然可以進(jìn)行乘法和加法運(yùn)算,但是一次只能加四位,而且乘法是一個(gè)多步指令序列。硅是愿意的,但 ALU 和位寬很弱。
第一個(gè)DSP芯片并沒有完全削減它
TRW 于 1976 年設(shè)法創(chuàng)建并銷售了 16×16 位單芯片數(shù)字乘法器——MPY016H——這是一款采用 1 微米雙極工藝技術(shù)制造的產(chǎn)品。TRW MPY016H 可以將兩個(gè) 16 位數(shù)字相乘以在 45 納秒內(nèi)產(chǎn)生 32 位結(jié)果(dash-1 部分為 40 納秒),但無法相加。您需要添加額外的 IC 以將累加器連接到乘法器。此外,您無法在一次操作中提取 32 位結(jié)果。您通過 IC 的 16 位輸出端口將結(jié)果分成兩部分。所以這個(gè)產(chǎn)品真的不是DSP。它只是 DSP 的一部分。此外,由于具有兩個(gè) 16 位輸入端口和一個(gè) 16 位輸出端口,TRW MPY016H 必須封裝在 64 引腳寬 DIP 中。它以 5V 電壓運(yùn)行,但它幾乎需要一個(gè)放大器才能啟動(dòng)。在 5 瓦時(shí),它也需要一點(diǎn)冷卻。
AMI 于 1978 年推出了 S2811 信號(hào)處理外設(shè),它是一個(gè)帶有 12 位硬件乘法器、一個(gè) 16 位 ALU 和一個(gè) 16 位輸出的 DSP,但它并不是作為單芯片 DSP 設(shè)計(jì)的。AMI 將 S2811 設(shè)計(jì)為用于 8 位 6800 微處理器的存儲(chǔ)器映射外圍設(shè)備,AMI 還制造該產(chǎn)品作為微處理器的創(chuàng)始人摩托羅拉半導(dǎo)體的替代來源。AMI 的 6800 微處理器版本被稱為 S6800。
6800 微處理器通過一個(gè)小型和三個(gè)較大的片上多端口 RAM 配置和訪問 AMI S2811。盡管 AMI S2811 于 1978 年發(fā)布,但它基于一種難以制造的 VMOS 工藝技術(shù),因此推遲了幾年的到來。到那時(shí),已經(jīng)發(fā)布了幾款單芯片DSP;隨著 Intel 8088、Zilog Z8000 和 Motorola 68000 的推出,16 位微處理器時(shí)代已經(jīng)到來;6800微處理器外設(shè)市場(chǎng)開始迅速萎縮。那就使得過時(shí)的 AMI S2811 從未取得商業(yè)成功。
在AMI 推出 S2811 信號(hào)處理外設(shè)的同一年,TI 向消費(fèi)者推出了一款基于 DSP 的玩具,即電池供電的“Speak & Spell”,該玩具采用 LPC 作為其核心語音編碼技術(shù)。Speak & Spell 玩具采用了 TI TMC0280 語音合成器芯片,該芯片在硬件中實(shí)現(xiàn)了 Binshu Atal 的 LPC 算法。TO TMC0280 本質(zhì)上是一個(gè)專用的 DSP。
盡管當(dāng)時(shí)的半導(dǎo)體技術(shù)將 TI Speak & Spell 的詞匯量限制在 165 個(gè)單詞,但這款玩具的稀疏詞匯量對(duì)于兒童玩具來說是一個(gè)巨大的技術(shù)飛躍,即使零售價(jià)高達(dá)(當(dāng)時(shí))50 美元。盡管 TI TMC0280 是一種專門的專用語音 DSP,但其低成本和電池運(yùn)行時(shí)間的能力為即將到來的 DSP IC 指明了道路。
1979 年 2 月,英特爾試圖通過宣布英特爾 2920“模擬信號(hào)處理器”來表達(dá)“是的,我們可以做到”。這個(gè)奇怪的集成 DSP 在前端有一個(gè) 9 位 ADC(8 位加符號(hào))和一個(gè)四輸入模擬多路復(fù)用器,一個(gè) 9 位 DAC 有一個(gè) 8 通道模擬采樣保持電路和模擬多路復(fù)用器在前端后端,中間的數(shù)字 ALU 能夠執(zhí)行加法、減法和絕對(duì)值運(yùn)算以產(chǎn)生 25 位結(jié)果。缺少乘法和除法指令迫使使用多指令序列來執(zhí)行這些所需的 DSP 數(shù)學(xué)運(yùn)算。每個(gè)乘法運(yùn)算需要 12 條指令,除法運(yùn)算需要 14 條指令。每條 Intel 2920 指令需要大約半微秒來執(zhí)行,
Intel 2920 是為信號(hào)過濾應(yīng)用而設(shè)計(jì)的,但它的執(zhí)行速度慢、數(shù)據(jù)路徑有限、指令集獨(dú)特、缺少硬件乘法器、模擬輸入和輸出電壓范圍有限以及其他嚴(yán)重的限制,這些都注定了該 IC 的商業(yè)失敗。
因此,盡管很少有人記得英特爾 2920,但它也預(yù)示著 DSP 的到來。
隨著 1970 年代結(jié)束,世界顯然已經(jīng)準(zhǔn)備好,甚至渴望真正的單芯片 DSP。多虧了理論家,算法才得以開發(fā)并準(zhǔn)備就緒。許多信號(hào)處理應(yīng)用都在乞求功能強(qiáng)大的 DSP 芯片。剩下的就是開發(fā)能夠支持這些要求的芯片設(shè)計(jì)和工藝技術(shù)。AMI、AT&T、英特爾、松下、摩托羅拉、NEC、TI、ADI 公司和其他公司都在為這個(gè)問題而瘋狂地工作。DSP 芯片的爆炸式增長(zhǎng)迫在眉睫。
在 1948 年 DSP 的奇跡年之后,又過了三個(gè)十年,實(shí)際的、實(shí)用的 DSP 芯片才會(huì)出現(xiàn)。像 TRW 的 MPY016H 硬件乘法器和 TI 的 TMC0280 LPC 語音芯片這樣的 DSP 零碎部件被戲弄了——真正的集成 DSP 指日可待——但直到 1980 年代,半導(dǎo)體技術(shù)才發(fā)展到足以使可編程 DSP 芯片實(shí)用化。1980 年代和 1990 年代,單芯片 DSP 的數(shù)量呈爆炸式增長(zhǎng)。
然后,20年后,單芯片DSP的時(shí)代戛然而止。
Wally Rhines 在 1970 年代為德州儀器 (TI) 工作,他非常想離開 TI 在德克薩斯州Lubbock的工廠。當(dāng)他有機(jī)會(huì)管理 TI 在休斯頓的微處理器業(yè)務(wù)時(shí),他選擇了這個(gè)職位,因?yàn)樗l(fā)現(xiàn)休斯頓是一個(gè)更具吸引力的居住地。此外,沒有人想要這份工作。TI 的 16 位 9900 微處理器由于其缺乏競(jìng)爭(zhēng)力的 16 位地址空間而陷入困境。由于未能在通用微處理器市場(chǎng)上分得一杯羹,萊茵斯在休斯頓 TI 新采用的微處理器團(tuán)隊(duì)創(chuàng)建了一個(gè)四管齊下的專用處理器戰(zhàn)略。TI 分叉戰(zhàn)略的四個(gè)方面是:
TMS320 DSP 系列
TMS340 系列圖形處理器
TMS360 大容量存儲(chǔ)處理器(很快無處可去)
用于 IBM 網(wǎng)絡(luò)架構(gòu)的 token-ring LAN 處理器TMS380
其中,TMS320 DSP 系列成為戰(zhàn)略中的搖滾明星。正如Rhines在接受采訪時(shí)所說,“……它給我們上了一課:絕望是創(chuàng)新之母?!?經(jīng)過幾年的醞釀,TI 于 1982 年 4 月推出了第一批 TMS320 DSP。然而,對(duì)于這樣的新技術(shù)來說,僅僅構(gòu)建芯片是不夠的。多年來,TI 一直在宣傳 DSP,并通過軟件開發(fā)工具和培訓(xùn)為其新 DSP 提供支持,然后才看到這些部件取得重大成功。根據(jù)Rhines的說法,TI 又過了五六年才開始從這些產(chǎn)品中看到一些真正的收入。
TI 不是第一個(gè)
然而,TI 的 DSP 芯片肯定不是市場(chǎng)上的第一個(gè)。英特爾早在 1979 年就推出了命運(yùn)多舛的 2920 模擬信號(hào)處理器,但該公司的另一款產(chǎn)品 16 位 8086 微處理器在其擁有 8 位外部數(shù)據(jù)總線的“弟弟”—— 8088 微處理器——成為 IBM PC 的核心。Intel 2920 從視線中消失了,很可能是因?yàn)?Intel 的全部注意力都被吸引到了通用微處理器市場(chǎng)。
TI 只是 1980 年代初期準(zhǔn)備進(jìn)入 DSP 領(lǐng)域的幾家半導(dǎo)體公司之一。根據(jù) Forward Concepts 總裁和數(shù)十年來一直聚焦在DSP的分析師 Will Strauss 的說法,第一批發(fā)布的帶有硬件乘法器/累加器的“真正”單芯片 DSP 是 AT&T DSP-1——由貝爾實(shí)驗(yàn)室開發(fā),并在1979 年 5 月的 AT&T 內(nèi)部會(huì)議上亮相 。1980 年 2 月在 IEEE 固態(tài)電路會(huì)議上,NEC又帶來了NEC ?PD7720。AT&T 將 DSP-1 納入其開創(chuàng)性的電話網(wǎng)絡(luò) 5ESS 電子交換系統(tǒng)。隨后,AT&T 繼續(xù)開發(fā)了幾代設(shè)備,其中包括 DSP16 和 DSP32(第一個(gè)浮點(diǎn) DSP 芯片)。然而,AT&T DSP-1 及其后繼者仍然被貝爾系統(tǒng)所擁有,
NEC ?PD7720 有一個(gè) 16×16 位乘法器和兩個(gè) 16 位累加器,因此它是一個(gè)真正的單芯片 DSP。盡管 NEC 在 1980 年初宣布了該設(shè)備,但它直到 1981 年才與所需的開發(fā)工具一起上市。Strauss 指出,NEC ?PD7720 在日本取得了最大的成功,就像日本的許多可編程 IC 一樣,這顆芯片在歐洲也很流行。
從 1986 年推出的 DSP56000 處理器開始,摩托羅拉半導(dǎo)體成為 1980 年代爭(zhēng)奪 DSP 芯片主導(dǎo)地位的另一個(gè)早期競(jìng)爭(zhēng)者。摩托羅拉 DSP56000 有一個(gè) 24 位硬件乘法器和兩個(gè)可以再擴(kuò)展 8 位的 48 位累加器使用一對(duì)擴(kuò)展寄存器。這種大數(shù)據(jù)字能力使摩托羅拉 DSP56000 能夠處理高精度音頻,因此摩托羅拉 DSP56000 迅速受到高端音頻系統(tǒng)開發(fā)商的歡迎。
在 1990 年代決斗
DSP 領(lǐng)域的主要參與者在 1980 年代和 1990 年代爭(zhēng)奪主導(dǎo)地位。他們生產(chǎn)了多代越來越強(qiáng)大的設(shè)備,這些設(shè)備具有多個(gè)硬件乘法器、浮點(diǎn)硬件乘法器和更大容量的片上存儲(chǔ)器。到 1990 年代后期,TI、摩托羅拉和飛利浦已經(jīng)開發(fā)出具有 VLIW 架構(gòu)、多個(gè)乘法器/累加器以及用于特殊操作(例如位混頻)的附加功能單元的 DSP 怪獸處理器。
當(dāng)競(jìng)爭(zhēng)性芯片技術(shù)突然出現(xiàn)并讓 DSP 供應(yīng)商蒙蔽時(shí),更大、更強(qiáng)大的獨(dú)立 DSP 芯片的開發(fā)突然停止。正如希克蘇魯伯小行星在 6600 萬年前消滅了恐龍,并在巖層中留下一層薄薄的銥作為名片一樣,F(xiàn)PGA 在千禧年之交讓單芯片 DSP 黨崩潰了。
DSP 的一個(gè)基本原理和一些歷史相結(jié)合,解釋了 FPGA 如何以及為什么迅速消滅單芯片 DSP 作為一個(gè)充滿活力的處理器類別。
首先,原理:DSP 全是數(shù)學(xué),DSP 性能依賴于非常快速地執(zhí)行大量乘法/累加運(yùn)算 (MAC) 的能力。這就是為什么最新的單芯片 DSP 具有多個(gè)硬件乘法器/累加器單元和附加功能單元以從乘法器/累加器路由非 MAC 操作的原因。設(shè)備擁有的 MAC 單元越多,執(zhí)行 DSP 操作的速度就越快,因?yàn)榇蠖鄶?shù) DSP 算法都包含多個(gè) MAC 單元可以利用的許多固有并行性。
現(xiàn)在,回顧歷史:FPGA 于 1984 年首次亮相,當(dāng)時(shí) Xilinx 推出 XC2064。第一個(gè) FPGA 只不過是一堆非常慢的門(實(shí)際上是基于查找表的可編程邏輯塊),周圍有很多可編程互連。這種早期的架構(gòu)設(shè)計(jì)使 FPGA 能夠在電路板設(shè)計(jì)上吞噬許多 TTL 芯片的邏輯。但是最早的 FPGA 速度很慢。他們沒有威脅到當(dāng)時(shí)的處理器,當(dāng)然也沒有影響到 DSP 領(lǐng)域。反正一開始不是。
FPGA 擴(kuò)張時(shí)代
由于從一開始FPGA就打算騎著摩爾定律,因此FPGA發(fā)展到2000年,就從原來的Xilinx XC2064 微不足道的64邏輯塊增長(zhǎng)到數(shù)以萬計(jì)的邏輯塊。在一篇題為“Three Ages of FPGAs: A Retrospective on the First Thirty Years of FPGA Technology”的文章中,前 Xilinx 研究員 Steve Trimberger 將 1990 年代的 FPGA 增長(zhǎng)時(shí)期稱為“擴(kuò)展時(shí)代”。在這個(gè)時(shí)代,F(xiàn)PGA 沿著摩爾定律曲線發(fā)展,并通過集成越來越多的可編程邏輯塊而變得越來越大。然而,與 ASIC 相比,在 FPGA 內(nèi)用可編程邏輯構(gòu)建的電路相對(duì)較慢,在硅片使用方面效率低下,而且價(jià)格更高。因此,使用可編程邏輯構(gòu)建的 MAC 相對(duì)較慢且成本較高。
后來,在 Trimberger 的“積累時(shí)代”——當(dāng) FPGA 添加硬化 MAC 塊時(shí)——FPGA 突然成為 DSP 的重要競(jìng)爭(zhēng)對(duì)手。FPGA 并不僅僅增加了一兩個(gè)硬件乘法器;在摩爾定律的慷慨支持下,他們?cè)黾恿藥资畟€(gè)。
第一個(gè)集成快速硬件乘法器的 FPGA 器件系列是 Xilinx Virtex-II FPGA 系列。2001 年 7 月,Xilinx 宣布它已經(jīng)出貨了價(jià)值 100 萬美元的 Virtex-II XC2V6000 FPGA,每個(gè) FPGA 都有 144 個(gè)硬化的片上 18×18 位乘法器。因此,第一個(gè)包含硬件乘法器的 FPGA 的性能已經(jīng)超過了當(dāng)時(shí)存在的每一個(gè)單芯片 DSP,而且很可能超過了所有將要存在的單芯片 DSP。
Altera 緊隨 Xilinx 并于 2002 年發(fā)布了其第一代具有 36×36 位硬件乘法器的 Stratix FPGA。Stratix FPGA 中的硬件乘法器可拆分為 18×18 位或 9×9 位乘法器,以允許更多的 MAC 運(yùn)算,盡管位分辨率較低。在本世紀(jì)的頭幾年,Xilinx 和 Altera FPGA 系列在可以執(zhí)行的同步 MAC 操作數(shù)量上遠(yuǎn)遠(yuǎn)超過單芯片 DSP。
今天的 FPGA 有很多 MACS
今天,英特爾(2015 年收購(gòu)了 Altera)和賽靈思的一些最小的 FPGA 提供了大量的硬件乘法器。較舊但仍然可用的 Intel Cyclone IV FPGA 系列的成員包含 80 到 532 個(gè) 18×18 位嵌入式乘法器。同樣,較舊的 Xilinx Spartan 6 FPGA 系列包括具有 8 到 180 個(gè) DSP48A1 slice 的器件,而較新的 Xilinx Artix FPGA 系列的成員包含多達(dá) 740 個(gè) DSP48E1 slice。每個(gè) DSP48A1 Slice 包含一個(gè) 18×18 位乘法器和一個(gè) 48 位累加器,而每個(gè) DSP48E1 Slice 包含一個(gè) 25×18 位乘法器和一個(gè) 48 位累加器。DSP48 切片乘法器中的位數(shù)似乎隨著時(shí)間的推移而增加。
Intel 和 Xilinx 的最大 FPGA 具有數(shù)千個(gè) DSP 模塊,并且能夠比最快的 DSP 芯片每秒提供三個(gè)數(shù)量級(jí)的 MAC。例如,最大的 Intel Stratix 10 TX FPGA 系列的成員提供 5760 個(gè)精度可調(diào) DSP 模塊,每個(gè)模塊包含兩個(gè) 18×19 位硬件乘法器,可以配置為一個(gè) 27×27 位乘法器。在一個(gè)大芯片上多達(dá) 11,520 個(gè)硬件乘法器。最大的 Xilinx Virtex UltraScale Plus FPGA 包含 12,288 個(gè) DSP48E2 slice,每個(gè) slice 包含一個(gè) 27×18 位乘法器和一個(gè) 48 位累加器。
請(qǐng)注意,英特爾和賽靈思并不是唯一將硬件乘法器塞入其 FPGA 的 FPGA 供應(yīng)商。您可以從 Achronix、Lattice 和 Microchip 獲得 FPGA,這些 FPGA 具有內(nèi)置在設(shè)備中的各種 DSP 硬件(MAC)。例如,最近發(fā)布的 Lattice CertusPRO-NX FPGA 有兩種尺寸可供選擇,具有 96 或 156 個(gè)片上 18×18 位乘法器。
如果您仍想編寫 DSP 代碼并在單片 DSP 上運(yùn)行它,你可以使用恩智浦提供 DSP56300、DSP56700 和 MSC8000 DSP 系列。這些是摩托羅拉 DSP 系列最新的——也可能是最后的——單芯片后代。此外,您仍然可以購(gòu)買現(xiàn)成的 TI TMS320 FPGA 系列成員。同時(shí),硬件乘法器在通用處理器的設(shè)計(jì)中變得非常普遍,在那里您可以找到完全能夠提供可觀的 DSP 性能的巨型 512 位 SIMD 矢量單元,甚至在微控制器中,這樣您就可以更輕松地將 DSP 集成到即使是最小的嵌入式設(shè)計(jì)。
對(duì)于這一切,要感謝摩爾定律。
然而,在這一點(diǎn)上根本沒有可比性。如果您的高性能 DSP 應(yīng)用需要大量快速 MAC 運(yùn)算,那么具有成百上千個(gè)快速硬件乘法器的 FPGA 是獨(dú)一無二的合格產(chǎn)品。