《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動(dòng)態(tài) > 超越 i9-10900K!AMD Ryzen 5000系列處理器Zen 3架構(gòu)分析

超越 i9-10900K!AMD Ryzen 5000系列處理器Zen 3架構(gòu)分析

2020-11-13
來源:EETOP
關(guān)鍵詞: AMD Intel 處理器 Ryzen5000

  在過去很長的一段時(shí)間中,AMD一直無法在桌面處理器的單核心性能領(lǐng)先Intel,只能靠著在單一處理器封裝塞入更多核心,以及設(shè)定較低的價(jià)格,與對手在市場相互拼搏,然而AMD卻透過Ryzen 5000系列處理器反轉(zhuǎn)此一情況,就讓我們一起來看看Zen 3架構(gòu)的改變之處。

  重新設(shè)計(jì)整體架構(gòu)

  AMD在2017年的時(shí)候就曾宣示,他們將提供世界上最好的桌面處理器(We wanted to deliver the best desktop processors in the world andchange the industry along the way.),如今他們透過Zen 3架構(gòu)的Ryzen 5000系列處理器達(dá)成這一目標(biāo),我們通過性能實(shí)測,看到Ryzen 9 5900X的性能確實(shí)能超越其主要競爭對手Intel Core i9-10900K。

  繼AMD先前推出的Zen與Zen 2架構(gòu)后,Zen 3的是款完全重新設(shè)計(jì)(Ground-up Redesign)的處理器架構(gòu),包含強(qiáng)化前端、執(zhí)行引擎、存取、SoC架構(gòu)等部分都經(jīng)過改善,并帶來了顯著的性能與功能提升。

  強(qiáng)化前端的目標(biāo)為增加大量分枝的大型程序預(yù)取(Fetching)性能,尤其在大量分枝的大型程序,將L1分枝預(yù)測的緩沖區(qū)加倍至1024個(gè),并增加分枝預(yù)測器的通道寬度,增加預(yù)測錯(cuò)誤的回復(fù)速度,提升循序預(yù)取性能,并讓切換cache流水線的粒度更細(xì)。

  在執(zhí)行引擎部分,新架構(gòu)的設(shè)計(jì)目標(biāo)為縮短延遲并加大架構(gòu)以提高指令等級平行化(ILP,Instruction-Level Parallelism)的能力,在整數(shù)數(shù)據(jù)取用器、整數(shù)窗口、浮點(diǎn)數(shù)通道寬度、浮點(diǎn)數(shù)乘積累加運(yùn)算等部分也都進(jìn)行最佳化與性能提升。

  存取方面的改良目標(biāo)為擴(kuò)大架構(gòu)并強(qiáng)化預(yù)取能力,以滿足執(zhí)行引擎所需的更大量數(shù)據(jù)吞吐量,數(shù)據(jù)讀取與寫入的時(shí)鐘頻率較Zen 2皆有所提升。

1.jpg

  ▲ Zen架構(gòu)的旅程始于2017年,到現(xiàn)在已經(jīng)進(jìn)入Zen3世代。

2.jpg

  ▲ Zen3改進(jìn)的重點(diǎn)為提升IPC/單核心性能、降低延遲、提升功耗效率。

3.jpg

  ▲ Zen3重新設(shè)計(jì)整個(gè)處理器,前端、執(zhí)行引擎、存取、SoC架構(gòu)都有改進(jìn)。

4.jpg

  ▲預(yù)取與解碼區(qū)塊的架構(gòu)也有所更新,以降低分支預(yù)測的延遲。

5.jpg

  ▲ Zen 3透過多項(xiàng)功能改善,達(dá)到IPC平均提升19%的成就。

6.jpg

  ▲這19%來自Cache預(yù)取、執(zhí)行引擎、分枝預(yù)測、微指令Cache、前端、存取等各項(xiàng)性能改進(jìn)的貢獻(xiàn)。

  打破CCX屏障

  Zen 3的另一項(xiàng)重大改進(jìn),就是改進(jìn)了SoC架構(gòu),目標(biāo)同樣以降低延遲為主,同時(shí)縮短處理器核心對核心、核心對Cache、主存儲(chǔ)器等數(shù)據(jù)存取的延遲,并將L3Cache叢集增大1倍。

  在Zen 2架構(gòu)的設(shè)計(jì)中,單一處理器封裝最多可以容納2組CCD(Compute Die,運(yùn)算裸片)與1組IOD(Input/Output Die,輸出入裸片),每組CCD最多可以容納2組CCX(Core Complexes,核心復(fù)合體),而每組CCX最多可以容納4個(gè)處理器核心。舉例來說,可以透過2組具有4個(gè)處理器核心的CCX,組成1組CCD,達(dá)成8核心處理器配置。

  而Zen 3則將CCX可以容納的核心數(shù)提升至8個(gè),每組CCD則只能容納1組CCX。因此8核心處理器會(huì)有1組具有8個(gè)處理器核心的CCX,組成1組CCD。

  這樣最大的好處是可以把原本每組叢集只能容納4個(gè)核心的架構(gòu),改變?yōu)榭梢匀菁{8個(gè)核心,且把原本的2組16MB L3 Cache存儲(chǔ)器,合并為1組32MB的組態(tài)。

  如此一來可以縮短處理器核心之間通訊的延遲,例如在Zen 2架構(gòu)中如果位于不同CCX的處理器核心的需要溝通,則某核心需透過Infinity Fabric將數(shù)據(jù)傳至IOD,再由IOD交至另一核心,將會(huì)因?yàn)閭鬏斞舆t而影響性能,若處理器核心位于同一CCX則無此問題。

  另一方面,統(tǒng)一的32MB L3 Cache存儲(chǔ)器也比拆分為2組16MB更具效率,且能容納更大筆的數(shù)據(jù),有助于提升游戲性能表現(xiàn)。

  在制程方面,Zen 3的CCD采用與Zen 2一樣的臺(tái)積電7nm節(jié)點(diǎn)制程,并繼承在Ryzen 3000XT系列處理器所納入的設(shè)計(jì)改良,因此能再次推升最高時(shí)脈。IOD則完全延用先前12nm制程與設(shè)計(jì),并讓處理器相容于先前推出的500、400系列芯片片組。

7.png

  ▲Zen 3大改了CCX的組態(tài),將原本只能容納4個(gè)處理器核心的限制提升至8個(gè),也讓2組16MB L3 Cache存儲(chǔ)器合并為統(tǒng)一32MB區(qū)塊。

8.png

  ▲這樣的改變也讓8個(gè)處理器核心能共享同一塊L3 Cache存儲(chǔ)器,有助于提升多工性能表現(xiàn)。

9.jpg

  ▲以8核心的Ryzen 5000系列處理器為例,處理器封裝中包含CCD(其中有1組CCX)與IOD各1組。

10.jpg

  ▲ 16核心部分則有2組CCD與1組IOD。

11.jpg

  ▲首波推出的4款Ryzen 5000系列處理器價(jià)格從美金299元至799元不等,其中只有Ryzen5 5600X附上Wraith Stealth散熱器。

12.jpg

  ▲相較前代的Ryzen 3000XT系列處理器,Ryzen 5000系列處理器的同級產(chǎn)品皆漲價(jià)美金50元。

  整體而言,Ryzen 5000系列處理器的「歷史定位」在于單核心性能超級Intel旗艦產(chǎn)品,且依然維持核心較多的優(yōu)勢,因此無論在單核心或多核心程序表現(xiàn)都能追上或超越Intel(也需考慮軟件、編譯器、指令集等最佳化因素造成的性能影響),在游戲、電競、美術(shù)設(shè)計(jì)、影片編輯、電腦輔助制造(CAM)、電腦輔助設(shè)計(jì)(CAD)等應(yīng)用上都能帶來性能優(yōu)勢。

  比較可惜的是,Ryzen 5000系列處理器較同級的Ryzen 3000XT貴了50美元(如Ryzen 5 5600X與Ryzen 5 3600XT相比),這樣的定價(jià)策略當(dāng)然可以解釋為新款處理器帶來更大的性能提升,但仍與消費(fèi)者的期望相左。

  有趣的是,在AMD發(fā)表Ryzen5000系列處理器的消息后,Intel也不甘示弱,以RocketLake-S處理器反擊,并不小心把牙膏擠太大力,對于消費(fèi)者而言,這樣一來一往的競爭往往能讓產(chǎn)品的性能、價(jià)格更加親民,或許雙方未來都會(huì)陸續(xù)更貼近市場需求以得到消費(fèi)者的青睞。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。