落花有意隨流水,流水無(wú)情戀落花。英特爾和蘋(píng)果的良好關(guān)系,可以一直追溯到 2005 年,彼時(shí)這兩家巨頭在 Mac、一體機(jī)等桌面產(chǎn)品線合作較為融洽,但 2010 年以后,英特爾“擠牙膏”似的產(chǎn)品升級(jí)策略以及 2020 年蘋(píng)果 M1 的全新登場(chǎng),讓他們逐漸形同陌路,甚至最終分道揚(yáng)飆。
不過(guò)前不久英特爾新任 CEO 帕特·基辛格公開(kāi)表示想追回“前任”,放出豪言要造出一款比 M1 更能打的芯片,以爭(zhēng)取和蘋(píng)果再續(xù)前緣,結(jié)果話音未落就遭蘋(píng)果光速打臉:10 月 19 號(hào)蘋(píng)果炸場(chǎng)發(fā)布會(huì)上基于 ARM 架構(gòu)的 M1 Max 閃耀全場(chǎng),完爆各種 X86 架構(gòu)的處理器,用實(shí)力告訴英特爾什么叫“慢擠牙膏一時(shí)爽,追回前任火葬廠”,更向世界證明比 M1 更強(qiáng)的處理器也還是出于蘋(píng)果之手。
而令筆者更為欣喜的是,M1 Max 竟然還不是如今 ARM 架構(gòu)處理器最為高光的時(shí)刻,隔壁平頭哥半導(dǎo)體在云棲大會(huì)上拿出的倚天處理器,更是完美詮釋了什么叫“大就完了”。倚天 710 中集成的晶體管比 M1 MAX 還多 30 億,此外倚天還搭載了最新的 V9 系列 ARM 核心,在云計(jì)算領(lǐng)域強(qiáng)到“爆炸”。
在桌面與云方面接連遭受暴擊,幾乎讓英特爾的 X86 進(jìn)入了病危狀態(tài),后續(xù)再擠牙膏就沒(méi)法翻盤(pán)了。好在基辛格接手之后,英特爾已逐漸開(kāi)展了 IDM2.0 的全面轉(zhuǎn)型,經(jīng)歷過(guò)這個(gè)灰色星期三之后,英特爾會(huì)有什么回應(yīng)也值得我們期待。不過(guò)這都是后話了,我們還是先來(lái)看看 M1 Max 到底有多強(qiáng)。
M1 Max 到底有多強(qiáng)
M1 Max 搭建了一個(gè) 10 核心 CPU,其中包括 8 個(gè)大核,2 個(gè)小核,MAX 相較于 M1 初代性能直接提升 70%;GPU 性能提升了 3 倍;最令人驚艷的指標(biāo)是統(tǒng)一內(nèi)存管理技術(shù),即內(nèi)存與顯存共用統(tǒng)一管理;M1 MAX 內(nèi)存帶寬最高可達(dá) 400GB/s,是 M1 芯片的 6 倍,已經(jīng)達(dá)到了新一代游戲主機(jī)的水平。
據(jù)筆者所知,目前唯一一個(gè)能在內(nèi)存帶寬上與 M1 Max 一叫長(zhǎng)的是英偉達(dá) Grace 處理器。通過(guò) NVlink 技術(shù),Grace 中 CPU 到 GPU 的內(nèi)存帶寬可達(dá) 900GB/s。不過(guò)老黃的 Grace 目前還在 PPT 上沒(méi)下來(lái),但是搭建 M1 Max 的 Mac Pro 已經(jīng)開(kāi)始接受預(yù)訂并馬上就要與用戶見(jiàn)面了,因此可以說(shuō) M1 Max 在內(nèi)存帶寬方面幾乎是現(xiàn)階段地表最強(qiáng)。
而且最關(guān)鍵的是 M1 Max 的功耗控制還很好,幾乎是在沒(méi)有功耗、散熱問(wèn)題的性能下完成性能成倍的提升。目前的已而可謂是人是鬼都在秀,只有牙膏堿在挨揍。
M1 Max 為何這么強(qiáng)
由于目前只有發(fā)布會(huì)跑分圖的資料,而且以蘋(píng)果的調(diào)性也根本不會(huì)把芯片手冊(cè)拿出來(lái),想進(jìn)一步了解 M1 Max 估計(jì)還是要等大神把 Linux 移動(dòng)到 Mac Pro 上去才行。
CPU 和 GPU 的通信能力加強(qiáng),提升概率 100%。我們內(nèi)存與顯卡進(jìn)行統(tǒng)一管理,可以大大提高 CPU 與 GPU 的通信效率,從而增強(qiáng)圖像處理、3D 建模等任務(wù)的處理效率。CPU 和 GPU 通信速度的重要性可以用 M1 初代的例子來(lái)加以說(shuō)明,我們知道蘋(píng)果 M1 顯存與內(nèi)存加在一起只有 16G,而 M1 前一代的 Mac Pro 內(nèi)存是 128G,光是顯存都與 M1 持平 16G,不過(guò)搭載 M1 的入門(mén)版 Mac 在進(jìn)行圖像處理等任務(wù)時(shí),卻要比上一代頂配的 Mac 還要強(qiáng)出近一倍。而本次發(fā)布的 M1 Max 更是直接將內(nèi)存帶寬提升到初代 M1 的 6 位,其性能加強(qiáng)的程度也就可想而知了。正如上文所說(shuō)英偉達(dá)之前發(fā)布的 Grace 處理器也采用了和蘋(píng)果比較類(lèi)似的思路,相信未來(lái)會(huì)被英特爾、AMD 等 X86 廠商借鑒。
譯碼器增強(qiáng),提升概率 90%。目前處理器的流水線一般分為取指、譯碼、取操作數(shù)等等環(huán)節(jié),其中譯碼是一個(gè)非常重要的環(huán)節(jié)。譯碼器方面 ARM 架構(gòu)的精簡(jiǎn)指令集的確有一定優(yōu)勢(shì),由于指令都是定長(zhǎng)的,完全可以做出高效的多路譯碼器以提升效率。沒(méi)記錯(cuò)的話之前 M1 應(yīng)該是四路譯碼,當(dāng)時(shí)筆者就表示, M1在譯碼器這方面還有后手,未來(lái)還能更秀,這里筆者大膽預(yù)測(cè) M1 Max 的 CPU 應(yīng)該是能有 6 路指令解碼器,8?op 發(fā)射寬度,6 路分配、10 路執(zhí)行端口的指標(biāo)。具體如何待最終揭曉。
大小核心的調(diào)度升級(jí)。提升概率 70%。由于 M1 Max 大小核的配比是 4:1,而由于大核比較費(fèi)電,而小核又無(wú)法應(yīng)對(duì)高性能計(jì)算,因此像 M1 Max 表現(xiàn)這么均衡的處理大概率會(huì)用軟、硬結(jié)合的高度方案,比如英特爾在剛剛發(fā)布的 Alder Lake 處理器中搭建的 Thread Director 就是這樣一種軟、硬結(jié)合的核心調(diào)度方案,英特爾的做法是在處理器中集成了一個(gè)專(zhuān)用的 MCU,用來(lái)監(jiān)控當(dāng)前處理器內(nèi)核的運(yùn)行情況,能夠監(jiān)測(cè)到每個(gè)線程的特征,比如它運(yùn)行什么樣的指令集、它的性能需求如何等等。在收集完信息之后,MCU 會(huì)將收集到的信息反饋給操作系統(tǒng),再次操作系統(tǒng)把這些信息與線程調(diào)度信息相結(jié)合,判斷是否應(yīng)該將線程轉(zhuǎn)移到別的核心上。如果與操作系統(tǒng)結(jié)合的好話,那么一輪調(diào)度信息采集工作僅需要 30 微秒就能完成,而傳統(tǒng)方案調(diào)度器可能需要 100 多毫秒才能判斷出結(jié)論。由于 Mac OS 與 M1 Max 都是蘋(píng)果自己的產(chǎn)品,因此這個(gè)調(diào)試方案 Thread Director 更極致,不過(guò)由于英特爾在本次發(fā)布會(huì)上沒(méi)特別提到調(diào)度器方案的提升。
而對(duì)這么強(qiáng)的 M1 Max 筆者似乎只能在生態(tài)建設(shè)方面給蘋(píng)果提出一些建議了。我們知道英偉達(dá)之所以能在 AI 及區(qū)塊鏈方面有著如此出彩的表現(xiàn),高性能計(jì)算框架 CUDA 絕對(duì)是居功至偉,正是在 CUDA 的幫助下英偉爾的 GPU 進(jìn)可以 AI 訓(xùn)練、區(qū)塊鏈挖礦;退可以玩大型游戲,爽得不亦樂(lè)乎。目前蘋(píng)果的 M1 Max 最大的短板在于對(duì)于游戲的支持一般,尤其是 3A 級(jí)的大作更是很少登陸 M1 系列的平臺(tái)。如果未來(lái)像《悟空傳》之類(lèi)的游戲也能首發(fā)在 Mac 系列,那么 X86 甚至基于 X86 的游戲主機(jī)可能都要涼涼。
M1 Max 影響幾何
成也蕭何,敗也蕭何,我們知道云平臺(tái)最重要的工作是資源進(jìn)行嚴(yán)謹(jǐn)?shù)母綦x,由于 M1 Max 統(tǒng)一內(nèi)存管理技術(shù)太能打了,內(nèi)存與顯存之間的傳輸帶寬太高,因此這也決定了這款處理器很難在虛擬化的云環(huán)境中使用,所以 M1 Max 短期內(nèi)帶來(lái)的最大沖擊還應(yīng)該是在于桌面市場(chǎng)。
但是從長(zhǎng)期來(lái)看,英偉達(dá)收購(gòu) ARM 的計(jì)劃大概率是要黃了,我要是庫(kù)克是不可能放 ARM 出去的,就算放猛瑪也不放 ARM,放了 ARM 以后新一代 ARM V9 系列的處理器可能要 gg,建議黃教主去和 VMware 接觸,具體詳見(jiàn)《若 ARM 收購(gòu)不成,英偉達(dá)應(yīng)該轉(zhuǎn)向 VMware》。
筆者最大的期待是基于 M1 Max 版的 Linux 趕快遷移出來(lái),與此同時(shí),平頭哥的倚天有了,屠龍系列還遠(yuǎn)嗎?