摩爾定律不僅僅是關(guān)于晶體管數(shù)量的簡單經(jīng)驗法則,它還是一種經(jīng)濟、技術(shù)和發(fā)展的力量——而且強大到足以推動一些最大的芯片制造商采用面向未來的架構(gòu)方法。
這種力量促使 AMD 的一些主要架構(gòu)師通過采用chiplet(小芯片)方法,圍繞曾經(jīng)預(yù)期的新技術(shù)開發(fā)節(jié)奏重新規(guī)劃路線。
我們稍后會詳細(xì)了解他們考慮的原因和考慮的內(nèi)容,但首先,奠定基礎(chǔ)很有用。
AMD公布了自己的內(nèi)部估計(右),并對過去十年多出現(xiàn)的重要新工藝節(jié)點的粗略日期進行了估算。請注意 14nm 發(fā)生的情況——新技術(shù)以兩年為周期的頻率不斷發(fā)展,但隨著這一跳躍,它移動到三年并繼續(xù)擴展。該圖表充分說明了我們已經(jīng)非常了解的內(nèi)容——摩爾定律正在下滑,很快,這種下滑將是急劇的。
“制造集成芯片的成本一直在穩(wěn)步攀升,由于增加了掩模層(例如用于多重圖案化)、更具挑戰(zhàn)性和更復(fù)雜的制造(先進冶金、新材料)等,最新一代芯片的成本急劇增加,” AMD 團隊解釋?!疤幚砥髦圃焐滩粌H要為每個新的工藝節(jié)點等待更長時間,而且當(dāng)技術(shù)可用時,他們還必須支付更多費用。”
成本壓力很明顯:在這一點上瞄準(zhǔn)更高的密度將減緩創(chuàng)新,正如 AMD 團隊指出的那樣,盡管高密度設(shè)備的最終價格可以抵消一些高成本,“該行業(yè)現(xiàn)在正面臨著光刻掩模版的限制,這是可以制造多大硅芯片的實際上限?!?/p>
“每個小芯片都是使用與單片情況相同的標(biāo)準(zhǔn)光刻程序制造的,以生產(chǎn)更多數(shù)量的較小小芯片。然后單個小芯片進行 KGD 測試?,F(xiàn)在,對于與單片情況相同的故障分布,每個潛在缺陷導(dǎo)致僅丟棄大約四分之一的硅量。小芯片可以單獨測試,然后重新組裝并封裝到完整的最終 SoC 中??傮w結(jié)果是,每個晶圓都可以產(chǎn)生數(shù)量明顯更多的功能性 SoC?!?/p>
上面的示意圖顯示了一個假設(shè)的單片 32 核處理器。AMD 表示,他們自己的內(nèi)部分析和產(chǎn)品規(guī)劃練習(xí)表明,這樣的處理器在 14 納米工藝中需要 777 平方毫米的芯片面積。“雖然仍處于光罩限制范圍內(nèi),因此在技術(shù)上可制造,但如此大的芯片將非常昂貴,并使產(chǎn)品處于潛在的缺乏競爭力的位置?!?/p>
大部分讀者已經(jīng)很清楚這些趨勢,但值得強調(diào),因為這些壓力是 AMD 廣泛的小芯片戰(zhàn)略的核心。盡管這種方法的成本很高,但這就是全部。畢竟,如果小芯片是一個明顯的贏家,整個行業(yè)早就會追逐它了。
“小芯片設(shè)計需要更多的工程工作來將 SoC 劃分為正確數(shù)量和類型的小芯片。存在多種可能性,但并非所有可能性都能滿足成本限制、性能要求、IP 和芯片重用的簡易性等,”AMD 團隊解釋道。它還需要對互連進行重大研發(fā),涉及更長的路線,可能具有更高的阻抗、更低的可用帶寬、更高的功耗和/或更高的延遲。隨著電壓、時序、協(xié)議、SerDes 的變化,以及能夠在更多元素上復(fù)制所有測試和調(diào)試,互連的復(fù)雜性變得更加雜草叢生——所有這些都使小芯片看起來不那么明顯。
盡管存在這些復(fù)雜性,但小芯片方法的大部分優(yōu)勢在基于四個復(fù)制小芯片的第一代 AMD EPYC 處理器中變得明顯。其中每個都有 8 個“Zen”CPU 內(nèi)核,帶有 2 個 DDR4 內(nèi)存通道和 32 個 PCIe 通道,以滿足性能目標(biāo)。AMD 不得不為四個小芯片之間的 Infinity Fabric 互連留出一些額外的空間。設(shè)計團隊討論了從第一次運行中吸取的成本教訓(xùn):
“在 14 納米工藝中,每個小芯片的芯片面積為 213 平方毫米,總芯片面積為 4*213 平方毫米 = 852 平方毫米。與假設(shè)的單片 32 核芯片相比,這意味著大約 10% 的裸片面積開銷?;谑褂贸墒旃に嚰夹g(shù)的歷史缺陷密度數(shù)據(jù)的 AMD 內(nèi)部良率建模,我們估計四小芯片設(shè)計的最終成本僅為單片方法的約 0.59,盡管總硅消耗量增加了約 10%。”
除了降低成本之外,他們還能夠在產(chǎn)品中重復(fù)使用相同的方法,包括使用它們構(gòu)建一個 16 核部件,使 DDR4 通道增加一倍并提供 128 個 PCIe 通道。
但這一切都不是免費的。當(dāng)小芯片通過 Infinity Fabric 進行通信時會引入延遲,并且由于同一小芯片上的 DDR4 內(nèi)存通道數(shù)量不匹配,因此必須謹(jǐn)慎處理某些內(nèi)存請求。
這些教訓(xùn)被用于第二代 7nm Epyc 處理器。有關(guān)于各種權(quán)衡和技術(shù)挑戰(zhàn)的令人難以置信的豐富的討論,以及成本和性能。包括封裝決策背后的因素,共同設(shè)計挑戰(zhàn),優(yōu)化和類似的方法的跨產(chǎn)品的擴展。
“除了技術(shù)挑戰(zhàn)之外,在如此多的細(xì)分市場中實施如此廣泛的小芯片方法還需要技術(shù)團隊、業(yè)務(wù)部門和我們的外部合作伙伴之間的大量合作和信任,”該團隊總結(jié)道。
“跨市場的產(chǎn)品路線圖必須仔細(xì)協(xié)調(diào)并相互安排,以確保在合適的時間推出合適的芯片以推出每種產(chǎn)品。意外的挑戰(zhàn)和障礙可能會出現(xiàn),世界一流且充滿激情的 AMD 工程團隊遍布全球。AMD 小芯片方法的成功既是工程上的壯舉,也是對擁有不同技能和專業(yè)知識的團隊的力量的證明,他們?yōu)閷崿F(xiàn)共同的目標(biāo)和共同愿景而共同努力。”