91视频APP福利导航,亚洲男人AⅤ无码在线,国产成人精品永久免费视频

蘋果M1芯片深度測試

日期： 2020-11-18

來源：半導(dǎo)體行業(yè)觀察

關(guān)鍵詞： 蘋果公司 MAC 芯片

　　上周，蘋果公司發(fā)布了基于他們新Apple Silicon M1 SoC芯片打造新Mac產(chǎn)品，這個(gè)新聞在行業(yè)內(nèi)引起了轟動(dòng)，因?yàn)檫@標(biāo)志著蘋果正式開啟了從Intel的x86 CPU過渡到該公司自己基于Arm架構(gòu)設(shè)計(jì)的內(nèi)部產(chǎn)品的兩年計(jì)劃第一步。

　　在發(fā)布會(huì)期間，我們根據(jù)該公司已經(jīng)發(fā)布的Apple A14芯片（在新一代iPhone 12手機(jī)中使用）撰寫了一篇詳盡的文章，當(dāng)中包括對Apple的新Firestorm內(nèi)核的微體系結(jié)構(gòu)的深入研究，這些內(nèi)核同時(shí)為A14和新的Apple Silicon M1提供動(dòng)力，如果您還沒有機(jī)會(huì)看的話，我建議您閱讀《深度解讀蘋果M1芯片》。

　　幾天以來，我們已經(jīng)能夠接觸到首批Apple Silicon M1設(shè)備之一：全新的Mac mini 2020版本。在上周的分析文章中，我們基于A14得出了數(shù)字，而這次，我們根據(jù)實(shí)際的新高功率設(shè)計(jì)測量了實(shí)際性能。我們沒有很多時(shí)間，但是我們將為您帶來與新的Apple Silicon M1相關(guān)的關(guān)鍵數(shù)據(jù)點(diǎn)。

　　Apple Silicon M1：Firestorm內(nèi)核的3.2GHz和約20-24W TDP？

　　在Apple的演示文稿中，缺少芯片時(shí)鐘頻率的實(shí)際細(xì)節(jié)以及可以保持最高性能的TDP是他們的一貫風(fēng)格。

微信圖片_20201118104833.png

　　但我們可以確認(rèn)，在單線程工作負(fù)載中，Apple的Firestorm內(nèi)核現(xiàn)在的時(shí)鐘頻率為3.2GHz，比Apple A14的3GHz頻率提高了6.66％。只要有散熱空間，此時(shí)鐘也適用于所有內(nèi)核負(fù)載，除了4個(gè)3.2GHz性能內(nèi)核以外，我們在2064MHz處還可以看到4個(gè)Thunde效率內(nèi)核，這也比A14上的1823MHz高出很多。

　　除了四個(gè)高性能的Firestorm核心之外，M1還包括四個(gè)Icestorm核心，旨在降低閑置功率并提高電池供電情境下的電源效率。4個(gè)性能內(nèi)核和4個(gè)效率內(nèi)核都可以同時(shí)激活，這意味著這是8內(nèi)核SoC，盡管所有內(nèi)核的性能吞吐量并不相同。

　　發(fā)布會(huì)期間最大的問題是這些設(shè)計(jì)的功耗。蘋果已經(jīng)提供了包括性能和功率軸在內(nèi)的幾張圖表，但是我們?nèi)狈Ρ容^數(shù)據(jù)來得出正確的結(jié)論。

　　由于我們可以使用Mac mini而不是Macbook，因此這意味著設(shè)備上的功率測量非常簡單，因?yàn)槲覀冎恍鑼x表連接到設(shè)備的AC輸入即可。值得一提的是，由于我們在這里測量的是交流電源，因此功率數(shù)字不能直接與電池供電的設(shè)備相提并論，因?yàn)镸ac mini的電源會(huì)帶來比其他設(shè)備更大的效率損失。

　　尤其重要的是要記住，我們通常談到的處理器中的TDP數(shù)實(shí)際上只是此處提供的數(shù)字的一個(gè)子集，因?yàn)槌薙oC，我們還在測量DRAM和電壓調(diào)節(jié)開銷，而這并不是包含在TDP數(shù)據(jù)中，也不包括筆記本電腦上的典型封裝電源讀數(shù)。

微信圖片_20201118104837.png

　　從空閑的Mac mini處于默認(rèn)狀態(tài)開始，我們把打開電源后的設(shè)備看作空閑狀態(tài)，在通過HDMI連接到2560p144顯示器，Wi-Fi 6和鼠標(biāo)和鍵盤，我們看到的設(shè)備總功率為4.2W。鑒于我們正在測量設(shè)備的交流電源，這在低負(fù)載下可能效率很低，這在很大程度上是有意義的，并且代表了一個(gè)很好的數(shù)字。

　　該閑置數(shù)據(jù)還用作后續(xù)測量的基準(zhǔn)，在這些測量中我們計(jì)算“有功功率”（active power），這意味著我們通常采用的方法是測量總功率并減去閑置功率。

　　在3.2GHz Firestorm內(nèi)核上的平均單線程工作負(fù)載（例如GCC代碼編譯）期間，我們看到設(shè)備功率高達(dá)10.5W，有功功率約為6.3W。有功功率與我們對更高頻率的Firestorm內(nèi)核的期望非常一致，并且對于Apple和M1來說是極有希望的。

　　在工作量更大的DRAM上，從而在Mac mini上的LPDDR4X級(jí)128位16GB DRAM上造成更大的功率損失，我們看到有功功率高達(dá)10.5W。有了這些數(shù)據(jù)，新的M1可能會(huì)給人留下深刻的印象，并且其展示能力還不到高端英特爾移動(dòng)CPU的三分之一。

　　在多線程方案中，電源高度依賴于工作負(fù)載。在CPU利用率不高的內(nèi)存密集型工作負(fù)載中，我們看到有功功率為18W，平均工作負(fù)載約為22W，在計(jì)算繁重的工作負(fù)載中峰值約為27W。這些數(shù)字通常是您希望與其他平臺(tái)的“ TDP”進(jìn)行比較的數(shù)字，盡管要再次進(jìn)行比較，您需要進(jìn)一步減去一些在Mac mini上測算的開銷。最好的猜測是20至24W的范圍。

　　最后，在GPU方面，我們看到GFXBench Aztec High的功耗降低了17.3W。這將包含大量的DRAM功耗，因此Apple GPU的功耗絕對是極低的功耗，并且遠(yuǎn)遠(yuǎn)小于CPU可以消耗的峰值功率。

　　存儲(chǔ)差異

　　除了CPU和GPU上的其他內(nèi)核外，M1與A14的主要區(qū)別還在于它運(yùn)行在128位內(nèi)存總線上，而不是在移動(dòng)64位總線上。在8個(gè)16位內(nèi)存通道和LPDDR4X-4266級(jí)內(nèi)存中，這意味著M1達(dá)到了68.25GB / s的內(nèi)存帶寬峰值。

微信圖片_20201118104840.png

　　在內(nèi)存延遲方面，我們發(fā)現(xiàn)M1較之A14（預(yù)期的）減少了，在128MB完全隨機(jī)測試深度（full random test depth）下測量為96ns，而在A14上為102ns。

　　還需要注意的是性能核心的12MB L2緩存，盡管在這里蘋果似乎仍在對單個(gè)核心可使用的數(shù)量進(jìn)行分區(qū)，因?yàn)槲覀內(nèi)匀豢吹?MB之后的延遲有所增加。

　　M1還包含一個(gè)較大的SLC緩存，芯片上的所有IP塊都應(yīng)可以訪問該緩存，但我們不確定。不給過測試結(jié)果的確與A14相似，因此我們假設(shè)這是SoC上類似的16MB緩存塊，因?yàn)槟承┰L問模式超出了A14的訪問范圍，這在一定程度上是合理的較大的L2。

微信圖片_20201118104843.png

　　我們從未真正有機(jī)會(huì)進(jìn)行測試的一個(gè)方面就是，蘋果的核心在內(nèi)存帶寬方面到底有多出色。在M1內(nèi)部，結(jié)果是突破性的：一次Firestorm可以實(shí)現(xiàn)高達(dá)58GB / s的內(nèi)存讀取速度，而內(nèi)存寫入速度則為33-36GB / s。最重要的是，根據(jù)您使用的是標(biāo)量指令還是矢量指令，內(nèi)存副本（memory copies）的傳輸速度可以高達(dá)60至62GB / s。單個(gè)Firestorm內(nèi)核幾乎可以使內(nèi)存控制器飽和的事實(shí)令人震驚，因?yàn)檫@是我們以前在設(shè)計(jì)中從未見過的。

　　因?yàn)橐粋€(gè)內(nèi)核幾乎可以利用整個(gè)內(nèi)存帶寬，所以讓多個(gè)內(nèi)核同時(shí)訪問事物實(shí)際上并不會(huì)增加系統(tǒng)帶寬，但是實(shí)際上由于擁塞會(huì)降低有效實(shí)現(xiàn)的總帶寬。當(dāng)在內(nèi)存副本（memory copies）中同時(shí)使用性能核心和效率核心時(shí)，我特別指出了這一點(diǎn)——4個(gè)大核心以59GB / s的內(nèi)存副本（memory copies）達(dá)到峰值，但是一旦添加了效率核心，它就會(huì)降至49GB / s，當(dāng)所有內(nèi)核都處于活動(dòng)狀態(tài)時(shí)，速度可降至46GB / s，這表明系統(tǒng)中某處中存在瓶頸。

　　除了增加時(shí)鐘速度，增加L2之外，這種內(nèi)存提升還很有可能是M1區(qū)別于A14之外的另一個(gè)關(guān)鍵點(diǎn)，并讓其有能力與現(xiàn)有的x86廠商的競爭。

　　基準(zhǔn)測試

　　由于我們使用Mac mini的時(shí)間很少，而且這不僅是一個(gè)macOS系統(tǒng)，而且是一個(gè)新的基于Arm64的macOS系統(tǒng)，因此我們無法使用我們通常使用的基準(zhǔn)測試。在發(fā)布時(shí)，我們已經(jīng)進(jìn)行了各種可用的測試，以使我們對性能有一個(gè)大致的了解：

微信圖片_20201118104847.jpg

微信圖片_20201118104849.png

　　Cinebench是在macOS和Apple Silicon上初露頭角的一個(gè)特定基準(zhǔn)。在基于Cinema4D的首次基準(zhǔn)測試中，我們看到蘋果M1與市場上大部分的x86 CPU相比，擁有相當(dāng)大的優(yōu)勢，但輸給了Zen3和Tiger Lake CPU，后者似乎仍然具有優(yōu)勢。

　　值得注意的是，在x86模式下，Rosetta2基準(zhǔn)測試的性能不僅能夠跟上過去的Mac，而且還能勝過它們。

微信圖片_20201118104852.png

　　在多線程R23運(yùn)行中，M1版本Mac具有絕對的領(lǐng)先優(yōu)勢。值得一提的是，我們正在嘗試訪問其他系統(tǒng)以收集更多數(shù)據(jù)，并希望進(jìn)一步更新圖表。

微信圖片_20201118104855.png

　　在瀏覽器基準(zhǔn)測試中，Apple的CPU占據(jù)了主導(dǎo)地位，但是人們懷疑這是由于iPhone的CPU本身，還是僅歸因于瀏覽器和瀏覽器引擎?，F(xiàn)在可以在macOS和桌面Safari上運(yùn)行，并且能夠?qū)?shù)據(jù)與其他Intel Mac系統(tǒng)進(jìn)行比較，我們可以得出這樣的結(jié)論：性能優(yōu)勢歸功于Apple的CPU設(shè)計(jì)。

　　Web瀏覽性能似乎是Apple CPU的頭等大事，這是有道理的，因?yàn)樗且苿?dòng)SoC的殺手級(jí)工作量，也是日常生活中使用最多的工作量。

微信圖片_20201118104900.png

　　在Geekbench 5中，M1再次表現(xiàn)出色，因?yàn)樗鼘?shí)際上領(lǐng)先于我們的性能數(shù)據(jù)。即使在以x86兼容模式運(yùn)行時(shí)，M1與上一代高端CPU的頂級(jí)單線程性能相比不相伯仲，并且大大超過了Mac mini和Macbook的先前版本。

微信圖片_20201118104903.png

　　多線程性能取決于設(shè)計(jì)的內(nèi)核數(shù)和功耗效率。M1在這里輸給了2017年的15英寸Macbook Pro，它使用的Intel i7-7820HQ具有4核和8線程，得分翻倍。在收集數(shù)據(jù)點(diǎn)時(shí)，我們將添加更多的數(shù)據(jù)點(diǎn)。

　　M1 GPU性能：集成王者，獨(dú)立CPU的競爭對手

　　從Intel切換到Apple芯片上，重點(diǎn)主要應(yīng)該放在CPU內(nèi)核上，對此，我們有充分的理由，但M1在GPU方面的表示不容忽視。像他們的CPU內(nèi)核一樣，蘋果已經(jīng)開發(fā)了自己的GPU技術(shù)已有多年了，隨著向Apple Silicon的轉(zhuǎn)變，這些GPU設(shè)計(jì)也首次出現(xiàn)在Mac上。從性能的角度來看，這帶來的蓋板邊比蘋果的CPU還要大。

　　蘋果公司長期以來一直以要求GPU性能優(yōu)于一般PC OEM廠商而聞名。盡管許多英特爾合作伙伴都很樂意甚至在部分15英寸筆記本電腦中都配備了具有Intel UHD圖形和其他基準(zhǔn)解決方案的系統(tǒng)，但蘋果公司選擇在其15英寸MacBook Pro中交付獨(dú)立的GPU。而且，當(dāng)他們無法在13英寸型號(hào)中安裝獨(dú)立GPU時(shí)，他們將Intel的高級(jí)Iris GPU配置與更大的GPU和片上eDRAM緩存結(jié)合使用，從而成為這些功能更強(qiáng)大的芯片的唯一常規(guī)客戶。

　　因此，一段時(shí)間以來，蘋果一直希望獲得比英特爾默認(rèn)提供的更好的GPU性能。通過切換到自己的芯片，Apple最終可以通過建立具有他們想要的所有GPU性能的筆記本電腦SoC來賺錢。

微信圖片_20201118104907.jpg

　　同時(shí)，與向Apple Silicon過渡的CPU方面不同，圖形編程的高級(jí)性質(zhì)意味著Apple幾乎不依賴于開發(fā)人員，就可以立即準(zhǔn)備通用應(yīng)用程序以利用Apple的GPU?？梢钥隙ǖ氖牵腃PU代碼仍將產(chǎn)生更好的結(jié)果，因?yàn)閹缀鯖]有人聽說過純粹受GPU限制的工作負(fù)載，但是現(xiàn)有的Metal（甚至OpenGL）代碼現(xiàn)在可以在Apple的GPU上運(yùn)行，這意味著它立即使所有游戲和其他受GPU約束的工作負(fù)載受益。

　　至于M1 SoC的GPU，毫不奇怪，它看起來很像A14的GPU。但蘋果對設(shè)計(jì)進(jìn)行了一些調(diào)整，以適應(yīng)Mac的敏感性（例如，各種GPU紋理和表面格式），但總的來說，差異是在API級(jí)別上抽象出來的。

　　總體而言，隨著M1達(dá)到A14但更大，Apple已將其4核GPU設(shè)計(jì)從該SoC擴(kuò)展到了M1的8核。但與CPU時(shí)鐘速度相比，我們對GPU時(shí)鐘速度的了解甚至更少。

　　因此，目前尚不清楚蘋果是否真的提高了這些速度；但是如果GPU時(shí)鐘沒有提高，我會(huì)感到有些驚訝?？傮w而言，按照智能手機(jī)標(biāo)準(zhǔn)，A14的4核GPU設(shè)計(jì)已經(jīng)非常強(qiáng)大，因此8核設(shè)計(jì)就更是如此。M1的集成GPU不僅旨在超越AMD和Intel的集成GPU，他們甚至還瞄準(zhǔn)了獨(dú)立GPU。

微信圖片_20201118104910.png

　　最后，應(yīng)該指出的是，Apple為M1提供了兩種不同的GPU配置。Mac Mini和MacBook Pro的芯片均啟用了所有8個(gè)GPU內(nèi)核。同時(shí)，對于Macbook Air，它取決于SKU：入門級(jí)型號(hào)具有7核配置，而更高級(jí)別的型號(hào)具有8核。這意味著入門級(jí)Air可獲得最弱的GPU（比完整的M1落后約12％）。

　　讓我們開始了解GPU性能，讓我們從GFXBench 5.0開始。這也是我們筆記本電腦評測的常規(guī)基準(zhǔn)之一，因此它為我們提供了一個(gè)很好的機(jī)會(huì)，將基于M1的Mac Mini與Mac生態(tài)系統(tǒng)內(nèi)外的各種其他CPU / GPU組合進(jìn)行比較。

　　總體而言，這并不是一個(gè)完全公平的測試，因?yàn)镸ac Mini是小型臺(tái)式機(jī)，而不是筆記本電腦，但是由于M1是筆記本電腦專用芯片，因此至少可以使我們了解M1在達(dá)到最佳狀態(tài)時(shí)的性能。

微信圖片_20201118104913.png

微信圖片_20201118104915.png

　　總體而言，M1的GPU在這里非常強(qiáng)大。在正常和高設(shè)置下，它都遠(yuǎn)遠(yuǎn)領(lǐng)先于其他集成GPU，甚至是獨(dú)立的Radeon RX 560X。只有到了NVIDIA的GTX 1650更強(qiáng)的GPU時(shí)，M1才漸落下風(fēng)。

　　順便說一句，我還通過Rosetta自由運(yùn)行了基準(zhǔn)測試的x86版本，以了解性能損失。至少在GFXBenchAztec Ruins中沒有。GPU的性能與本機(jī)二進(jìn)制文件和二進(jìn)制轉(zhuǎn)換幾乎完全相同。

微信圖片_20201118104918.png

　　最后，我們以完全愚蠢的合成基準(zhǔn)快速瀏覽了更廣闊的領(lǐng)域，我們有了3DMark Ice Storm Unlimited。由于Apple Silicon Macs能夠運(yùn)行iPhone / iPad應(yīng)用程序，因此我們能夠通過運(yùn)行iOS版本首次在Mac上運(yùn)行此基準(zhǔn)測試。這是為OpenGL ES 2.0時(shí)代建立的非常古老的基準(zhǔn)，但有趣的是它的性能甚至比GFXBench好。Mac Mini的性能恰好足以滑過配備GTX 1650的筆記本電腦，盡管這不會(huì)經(jīng)常發(fā)生，但它顯示了M1的強(qiáng)大功能。

微信圖片_20201118104921.png

微信圖片_20201118104924.png

　　為蘋果新Mac的發(fā)布而更新的另一個(gè)GPU基準(zhǔn)是BaseMark GPU。這不是我們的常規(guī)基準(zhǔn)測試，因此我們手頭上沒有其他非Mac筆記本電腦的分?jǐn)?shù)，但是它使我們可以更進(jìn)一步地了解M1與其他Mac GPU產(chǎn)品的比較。

　　2020年的Mac Mini仍然領(lǐng)先宇2018年基于Intel的Mac Mini，就此而言，它也比配備Radeon Pro 560的2017年MacBook Pro至少快50％。當(dāng)然，較新的MacBook Pro會(huì)做得更好，但是請記住，這是一個(gè)集成的GPU，整個(gè)芯片比MacBook Pro的CPU消耗的功率更少，因此不必?fù)?dān)心獨(dú)立的GPU。

微信圖片_20201118104927.png 微信圖片_20201118104929.png

　　最后，將理論付諸實(shí)踐，我們有了《Rise of the Tomb Raider》。該游戲于2016年發(fā)布，具有適當(dāng)?shù)腗ac端口和內(nèi)置基準(zhǔn)，使我們能夠在游戲場景中查看M1并將其與其他Windows筆記本電腦進(jìn)行比較。誠然，這款游戲的年齡稍大一些，但其性能要求與M1旨在提供的性能非常匹配。最后，應(yīng)該指出的是，這是x86游戲，尚未移植到Arm上，因此游戲的CPU端通過Rosetta運(yùn)行。

　　在我們的768p Value設(shè)置下，Mac Mini在這里提供了超過60fps的速度。它再次大大領(lǐng)先于2018年基于Intel的Mac Mini以及該堆棧中的所有其他集成GPU。即使是15英寸的MBP及其Radeon Pro 560仍然落后于Mac Mini 25％以上，Ryzen筆記本電腦和Radeon 560X最終要與Mac Mini保持一致。

　　同時(shí)，通過“發(fā)燒友”設(shè)置將事情提高到1080p時(shí)，發(fā)現(xiàn)基于M1的Mac Mini仍提供不到40fps的速度，并且比上述Ryzen + 560X系統(tǒng)高出20％以上。這確實(shí)使Mini遠(yuǎn)遠(yuǎn)落后于GTX 1650-Rosetta和常規(guī)API效率低下可能起了一定作用-但它表明了擊敗Apple集成GPU所需要的能力。Mac Mini以39.6fps的速度可以在1080p上以良好的圖像質(zhì)量設(shè)置進(jìn)行播放，并且相當(dāng)容易地降低分辨率或圖像質(zhì)量以使其恢復(fù)到60fps以上。全部在集成GPU上。

　　最終，這些基準(zhǔn)測試非常有力地證明了M1的集成GPU將不辜負(fù)蘋果公司在高性能GPU方面的聲譽(yù)。蘋果公司為Mac推出的首個(gè)Apple內(nèi)置GPU的速度明顯快于我們能夠使用的任何集成GPU，并且無疑將為筆記本電腦的GPU性能樹立新的高標(biāo)準(zhǔn)。

　　根據(jù)蘋果自己的die照片，很明顯，他們將M1模具的相當(dāng)一部分用于GPU和相關(guān)的硬件上，其收益是可以與低端獨(dú)立GPU媲美的GPU。鑒于M1只是未來的基線，蘋果將需要更強(qiáng)大的GPU用于高端筆記本電腦和其余臺(tái)式機(jī)，看到基線的GPU時(shí)蘋果及其開發(fā)者生態(tài)系統(tǒng)可以做什么將非常有趣即使是最便宜的Mac，其性能也很高。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

蘋果M1芯片深度測試

日期： 2020-11-18

來源：半導(dǎo)體行業(yè)觀察

相關(guān)內(nèi)容