不久前,Micro Magic公司(加利福尼亞州桑尼維爾)推出了一款64位RISC-V處理器,該處理器時(shí)鐘高達(dá)5GHz,但可以接近閾值的電壓工作。
該公司首席執(zhí)行官M(fèi)ark Santoro(馬克·桑托羅)指出,雖然該高時(shí)鐘頻率是罕見的案例,但更重要的成就是RISC-V處理器的低功耗性能。將工作電壓降到接近閾值電壓的 350mV 時(shí),性能降低 5 倍,但計(jì)算功率效率可提高 9 倍以上。
Santoro指出,該公司的歷史可以追溯到Sun Microsystems之前。該公司是一個(gè)相對(duì)較小的工程師群體(LinkedIn信息顯示不到50人),他們專門從事數(shù)據(jù)路徑設(shè)計(jì)、優(yōu)化和高速內(nèi)存設(shè)計(jì)。該公司最初成立于1995年1月,但于2000年12月被Juniper Networks以2.6億美元收購(gòu)。Micro Magic的創(chuàng)始人在2004年重新啟動(dòng)了公司。
盡管公司的創(chuàng)始人對(duì)研發(fā)領(lǐng)先的處理器很感興趣,但他們必須開發(fā)自己的 EDA 工具套件。自 2004 年進(jìn)行改革以來(lái),Micro Magic 一直是這些 EDA 工具的供應(yīng)商,也是一家設(shè)計(jì)服務(wù)公司,使用其工具改進(jìn)客戶的 ASIC。
桑托羅說(shuō),這些EDA工具的一個(gè)優(yōu)點(diǎn)是能夠根據(jù)時(shí)序要求放置和布線電路,從而使性能和定時(shí)閉合設(shè)計(jì)更加容易。
每瓦CoreMarks
桑托羅說(shuō):“CoreMarks似乎是一個(gè)合理的基準(zhǔn),但我們的設(shè)計(jì)是為能效而設(shè)計(jì)的,而不僅僅是性能。CoreMarks 是 EEMBC(嵌入式微處理器基準(zhǔn)聯(lián)盟)生產(chǎn)的績(jī)效基準(zhǔn)套件,是一個(gè)非盈利的會(huì)員資助組織。
”但每 MHz 的 CoreMarks 并不顯著,因?yàn)?CoreMarks 不會(huì)直接降低時(shí)鐘頻率。更重要的措施是每瓦CoreMarks,“桑托羅說(shuō)。然后,他提供了附加功耗的關(guān)鍵基準(zhǔn)圖。這是 RISC-V 內(nèi)核和一級(jí)緩存的功耗。
在 1.1V 時(shí),處理器的時(shí)鐘頻率為 5.14GHz,在消耗約 500mW 時(shí)實(shí)現(xiàn)了 13,333 個(gè) CoreMark。這相當(dāng)于近 27k CoreMark /瓦特。
0.8V的處理器運(yùn)行在4.3GHz和達(dá)到11,111 CoreMark,同時(shí)消耗200mW。這是55.5k CoreMark /瓦特。
在 0.6V 下,處理器以 3.1GHz 的速度運(yùn)行,達(dá)到 8,461 CoreMark,消耗約 70mW。這大約是121k CoreMark /瓦特。
運(yùn)行到350mV,在消耗10mW的同時(shí),實(shí)現(xiàn)了1GHz和2500 CoreMark的時(shí)鐘頻率。這是25萬(wàn)個(gè)CoreMark /瓦特。
將電壓降到三分之一,處理器的基準(zhǔn)測(cè)試沒有”裝箱“,這意味著同一芯片將能夠?qū)崿F(xiàn)最高的時(shí)鐘頻率性能和最高的計(jì)算功率效率。
不幸的是,由于緩存大小不同以及包含的外圍邏輯量,因此比較處理器并不總是容易的。
Micro Magic仍然沒有透露是哪家晶圓代工廠為其生產(chǎn)的芯片。我們被告知的是,它采用了 FinFET 制造工藝,公司已經(jīng)比較了三個(gè)制造廠 PDK ,對(duì)比了兼容性。這表明所選制程為 28nm 或以下,并且由于成本等原因,不會(huì)低于 10nm。這樣猜測(cè),代工廠只可能是Globalfoundries、三星或臺(tái)積電,英特爾和中芯國(guó)際也有可能。
沒有捷徑
但是當(dāng)我們問(wèn)桑托羅,他的團(tuán)隊(duì)是如何在10mW獲得2500個(gè)CoreMark的時(shí),他說(shuō):”沒有靈丹妙藥。低功耗沒有一件事。它是我們必須關(guān)注的很多事情的結(jié)合。桑托羅指出,回到太陽(yáng)實(shí)驗(yàn)室,他和其他工程師取得了最高性能的SRAM與900皮秒的訪問(wèn)時(shí)間。
“此外,當(dāng)您設(shè)計(jì)高性能時(shí),您必須注意電源。如果你不為低功耗設(shè)計(jì),你最終會(huì)熔化電線,”他補(bǔ)充說(shuō)。Santoro 重申,當(dāng)他最初創(chuàng)立 Micro Magic 時(shí),標(biāo)準(zhǔn)工業(yè)工具并不適合這種設(shè)計(jì)風(fēng)格。“我們必須編寫專用工具來(lái)構(gòu)建和分析記憶。我們必須創(chuàng)建用于計(jì)時(shí)感知放置和路由的工具。
他繼續(xù)說(shuō):”你可能還記得SiByte在宣布一個(gè)能夠以2GHz運(yùn)行的MIPS處理器時(shí)引起了轟動(dòng)。這是使用Micro Magic軟件放置的。西比特是由丹·多伯波爾創(chuàng)立的初創(chuàng)公司。該公司于2000年披露了其網(wǎng)絡(luò)處理器,2000年11月被 Broadcom 以價(jià)值超過(guò) 20 億美元的股票收購(gòu)。
實(shí)現(xiàn)高時(shí)鐘速度的傳統(tǒng)方法之一是在 ALU 中創(chuàng)建細(xì)粒度管道,以便完成較小的處理區(qū)塊,每個(gè)階段所需的邏輯更少,因此能夠以更高的時(shí)鐘頻率執(zhí)行。這也意味著許多指令正在管道中并行執(zhí)行。但是,這種好處伴隨著成本。
桑托羅指出,管道越深,當(dāng)管道中存在停滯時(shí),處理過(guò)程必須被丟棄。這種偶爾但大量浪費(fèi)的努力會(huì)降低能效。此類停滯可能出于各種原因,包括中斷和在緩存中找不到指令或數(shù)據(jù)輸入,需要加載新頁(yè)面。
此外,更深層次的管道需要更多的控制邏輯,這也會(huì)損害電源效率,并且有一種誘惑,即通過(guò)訂單和投機(jī)性執(zhí)行來(lái)增加復(fù)雜度,而這一切最終都需要更多的翻牌和更多的功率。
Santoro 不承認(rèn) Micro Magic 設(shè)計(jì)有多少管道階段,事實(shí)上,這樣的問(wèn)題往往取決于如何定義處理階段?!八中∮趾?jiǎn)單。即使在設(shè)計(jì)團(tuán)隊(duì)內(nèi)部,人們也爭(zhēng)論它有多少個(gè)管道階段。我們的 CoreMarks 可能很高,但我們不是為 CoreMarks 設(shè)計(jì)的。他繼續(xù)說(shuō):”建筑確實(shí)很重要,但工具很重要。
Santoro 解釋說(shuō),通過(guò)設(shè)計(jì)高速接入數(shù)據(jù)路徑,Micro Magic 可以快速完成管道階段,同時(shí)保持 ALU 的簡(jiǎn)單性,從而提升低功耗。
桑托羅也不會(huì)透露設(shè)計(jì)成工作芯片的 L1 緩存的大小?!澳憧偸窍胍螅覀兪窃趥鹘y(tǒng)大小某處。16k字節(jié)或32k字節(jié)在5GHz下難以運(yùn)行。這表明4kbyte或8kbyte的 L1 緩存大小。
盡管 Micro Magic 生產(chǎn)的工作芯片是單一內(nèi)核,但 Santoro 承認(rèn) IP 的被許可方很可能希望將內(nèi)核部署在四核或八核配置中。他說(shuō),Micro Magic設(shè)計(jì)可以很容易地去多核實(shí)現(xiàn),有一些掛鉤存在,這將有助于這樣的設(shè)計(jì)。
當(dāng)被問(wèn)及Micro Magic是否會(huì)考慮實(shí)施完全耗盡的絕緣硅工藝時(shí),桑托羅說(shuō):”FDSOI非常有趣。我們的設(shè)計(jì)中沒有任何東西可以排除 FDSOI 的使用。
然而,桑托羅指出,該公司選擇了FinFET制造工藝,試圖最大限度地提高該行業(yè)的可用性。FinFET 還提供通往領(lǐng)先制造工藝的明顯途徑 - 現(xiàn)在為 7nm 和 5nm。FDSOI 可能無(wú)法歸結(jié)為這樣的幾何形狀。
FinFET 流程和 FDSOI 之間有一些區(qū)別,但我們?cè)O(shè)計(jì)的工具具有適應(yīng)性,因此很容易將設(shè)計(jì)重新定位到不同的流程。他說(shuō)。桑托羅確實(shí)提出了警告?!叭绻阆肜?FDSOI 的后偏置功能,它確實(shí)會(huì)更多地參與其中。
Santoro 表示,值得注意的是,10nm 以下的前沿 FinFET 制程的應(yīng)用往往側(cè)重于兩極功能,適用于應(yīng)用領(lǐng)域:智能手機(jī)和高性能計(jì)算。一個(gè)是受功耗限制,同時(shí)仍然需要顯著的性能。另一個(gè)要求高性能,但仍必須追求能效。桑托羅將芯片的性能留給 5GHz 和 1GHz 來(lái)為自己說(shuō)話。
桑托羅在分手時(shí)指出,在工具集方面,Micro Magic已經(jīng)擁有三維布局工具超過(guò)15年。然而,由于主流EDA供應(yīng)商不支持3D設(shè)計(jì),它未能像桑托羅想象的那么快。”如果你太超前,你就不被接走,“他渴望地說(shuō)。
現(xiàn)在,隨著芯片級(jí)封裝開始進(jìn)入主流制造,Micro Magic完全有能力實(shí)現(xiàn)這樣的設(shè)計(jì)。
業(yè)務(wù)選擇
此外,Micro Magic 似乎也是從設(shè)計(jì)服務(wù)(它已成功執(zhí)行多年但無(wú)法很好地?cái)U(kuò)展的業(yè)務(wù))遷移到更具可擴(kuò)展性、面向產(chǎn)品的 IP 許可業(yè)務(wù)的好去處。或者,它也可以作為 EDA 公司(也是可擴(kuò)展的商業(yè)模式)繼續(xù)使用工具許可。
作為 EDA 工具供應(yīng)商的風(fēng)險(xiǎn)是,公司可能會(huì)卷入設(shè)計(jì)服務(wù)。許可核心作為產(chǎn)品也有挑戰(zhàn)。它需要權(quán)力堅(jiān)持產(chǎn)品計(jì)劃,并拒絕要求額外的鐘聲和口哨的核心。屈服于這一點(diǎn)的 IP 供應(yīng)商也融入了有效的定制設(shè)計(jì)。
”我們構(gòu)建了 RISC-V 設(shè)計(jì),以展示我們能做什么,以及我們的工具可以做什么,“Santoro 說(shuō)。”我們現(xiàn)在得到了很多的興趣。計(jì)劃是許可出核心,雖然事情已經(jīng)變得更加復(fù)雜。如果我們即將被收購(gòu),我們不想許可出核心。
鑒于Micro Magic在首次銷售中和2000年由SiByte實(shí)現(xiàn)的溢價(jià)價(jià)值,可以看明桑托羅為什么考慮公司的選擇。