123,123,123

博通与英伟达竞逐AI芯片新格局主导者

日期： 2024-12-18

來源：第一财经

關(guān)鍵詞： 博通英伟达 AI芯片 ASIC GPU

上周五美股博通大漲24.43%、市值站上萬億美元后，本周一博通股價又上漲了11.21%，市值達1.17萬億美元。該公司拿出超市場預(yù)期的一份最新財報后，市場對于AI定制芯片的興趣仍在高漲。即便周二美股多只芯片股普跌，博通周二股價回調(diào)跌3.91%，收盤市值也仍在1.1萬億美元以上。

在AI領(lǐng)域，博通涉足定制或?qū)Ｓ眉呻娐罚?a class="innerlink" href="http://ihrv.cn/tags/ASIC" target="_blank">ASIC）和以太網(wǎng)網(wǎng)絡(luò)部件，博通與三家大型云廠商合作開發(fā)定制AI芯片。作為一種更專用的芯片，ASIC和更通用的GPU（圖形處理器）站在了對立面，前者是谷歌、Meta、亞馬遜和諸多創(chuàng)業(yè)公司的陣營，后者則主要站著英偉達和AMD。

博通股價起飛只是ASIC反攻GPU陣營的一個前奏。除了用自研ASIC替代英偉達GPU的云廠商，ASIC領(lǐng)域的創(chuàng)業(yè)潮也在涌動，創(chuàng)業(yè)公司正在世界范圍內(nèi)尋找客戶。在業(yè)內(nèi)人士看來，GPU和ASIC之爭更像是一場通用和專用陣營之爭，在AI最終定型之前，兩種芯片都不會完全取代對方，這場博弈也不一定以一輸一贏為結(jié)果。

誰在給博通們創(chuàng)造業(yè)績？

GPU霸主英偉達在聚光燈下站了太久，人們可能容易忽略背后各云廠商的造芯努力，它們設(shè)計的ASIC滲透率可能比很多人想象的更深。

ASIC包含多類芯片，諸如TPU（Tensor Processing Unit，張量處理器）、LPU（語言處理器）、NPU（神經(jīng)網(wǎng)絡(luò)處理器）等。云廠商中，谷歌多年前就布局TPU，其第六代TPU Trillium在本月正式向客戶開放使用；Meta今年推出了專為AI訓(xùn)練和推理設(shè)計的定制芯片MTIA v2；亞馬遜有Trainium2，并計劃明年發(fā)布Trainium3；微軟則有自研AI芯片Azure Maia。

或許是因為不對外銷售芯片，這些云廠商的AI芯片比較少受到市場關(guān)注。但實際上，這些云廠商已在自己的數(shù)據(jù)中心部署ASIC芯片并著力擴大這些芯片的使用。

以谷歌為代表，TechInsights數(shù)據(jù)顯示，去年谷歌已悄然成為全球第三大數(shù)據(jù)中心處理器設(shè)計公司，位列CPU霸主英特爾和GPU霸主英偉達之后。谷歌內(nèi)部工作負載運行TPU而不對外出售芯片。

亞馬遜則向OpenAI的競爭對手Anthropic進行多次投資，加深與該公司的綁定。Anthropic就用了亞馬遜的Trainium。亞馬遜近日透露，建設(shè)給Anthropic使用的Rainier超級計算機集群項目很快會完成，亞馬遜還在建設(shè)更多產(chǎn)能以滿足其他客戶用Trainium的需求。

定制芯片廠商博通、Marvell的相關(guān)訂單就是來自這些云廠商。其中，谷歌、Meta的ASIC芯片與博通合作定制。除了谷歌，摩根大通分析師預(yù)測，Meta有望成為下一個為博通帶來10億美元收入的ASIC客戶。亞馬遜則與芯片廠商Marvell合作。本月初，亞馬遜AWS剛與Marvell達成一項為期五年的協(xié)議，雙方擬擴大在AI和數(shù)據(jù)中心連接產(chǎn)品方面的合作，以便亞馬遜部署半導(dǎo)體產(chǎn)品組合和專用網(wǎng)絡(luò)硬件。

體現(xiàn)在業(yè)績上，2024財年，博通收入同比增長44%，達到創(chuàng)紀錄的516億美元。該財年，博通人工智能收入同比增長220%，達到122億美元，推動公司的半導(dǎo)體收入達到創(chuàng)紀錄的301億美元。博通還展望2025財年第一季度收入同比增長22%。

據(jù)Marvell本月早些時候發(fā)布的2025財年第三季度財報，該季度公司營收則為15.16億美元，同比增長7%，環(huán)比增長19%，該公司稱環(huán)比增長幅度高于此前指引的中點，并預(yù)測下一季度營收還將環(huán)比增長19%。Marvell表示，第三季度的業(yè)績表現(xiàn)和對第四季度業(yè)績表現(xiàn)強勁的預(yù)期主要是由定制AI芯片項目推動的，這些項目已經(jīng)開始量產(chǎn)，并預(yù)計2026財年需求還將保持強勁勢頭。

除了谷歌、Meta、亞馬遜這些云廠商，OpenAI、蘋果也多次傳出與這類ASIC定制芯片廠商合作的消息。近日蘋果便傳出正在開發(fā)AI服務(wù)器芯片、正與博通合作開發(fā)該芯片網(wǎng)絡(luò)技術(shù)的消息，OpenAI此前傳出已與博通合作數(shù)月構(gòu)建AI推理芯片。

ASIC創(chuàng)業(yè)公司網(wǎng)羅客戶

云廠商自研大模型并通過投資綁定了一些大模型創(chuàng)業(yè)公司，與ASIC定制廠商合作的自研芯片用于這些大模型訓(xùn)練和推理，不需要依賴外售。ASIC創(chuàng)業(yè)公司則不同，它們選擇了不同的芯片代工商，并需要自己尋找客戶。

其中，推出了晶圓級芯片的Cerebras Systems將芯片交給臺積電生產(chǎn)，Etched的Sohu芯片采用臺積電4nm工藝。采用近存計算架構(gòu)的Groq LPU芯片對制程的要求沒有那么高，用了GlobalFoundries的14nm工藝。

這些ASIC創(chuàng)業(yè)公司正在全世界范圍內(nèi)網(wǎng)羅客戶，從正加碼布局AI的中東國家搜尋客戶成為一些ASIC創(chuàng)業(yè)公司的共同選擇。據(jù)Cerebras Systems公開的數(shù)據(jù)，2023年Cerebras Systems凈銷售額近7900萬美元，今年上半年達1.364億美元。2023年該公司來自阿聯(lián)酋阿布扎比的G42公司的收入占總收入83%，G42還承諾在明年購買價值14.3億美元的Cerebras Systems產(chǎn)品和服務(wù)。

記者9月在沙特阿拉伯的AI峰會上也看到了Cerebras Systems、Groq和另一家AI芯片初創(chuàng)公司SambaNova Systems的身影。Cerebras Systems當時與沙特阿美簽署了諒解備忘錄，沙特阿美計劃用Cerebras Systems的產(chǎn)品訓(xùn)練和部署大模型。

Groq則與沙特阿美的數(shù)字與技術(shù)子公司合作，計劃在沙特建設(shè)全球最大規(guī)模的推理數(shù)據(jù)中心，該數(shù)據(jù)中心今年年底建成投運，初期包括1.9萬個Groq LPU，未來有望擴展至20萬個 LPU。據(jù)SymbaNova Systems官網(wǎng)消息，該公司也與迪拜公司Solidus AI Tech合作，計劃為歐洲的高性能計算數(shù)據(jù)中心提供SymbaNova Cloud，并與在中東、南亞、歐洲、非洲地區(qū)開展業(yè)務(wù)的Canvass AI公司合作，向企業(yè)提供AI解決方案。

此外，據(jù)企業(yè)官網(wǎng)消息，SymbaNova Systems與美國阿貢國家實驗室合作。Groq則與面向美國和加拿大政府部門提供IT方案的廠商Carahsoft 合作，并與能源領(lǐng)域的Earth Wind&Power合作，計劃在挪威建設(shè)AI計算中心。

專用與通用之爭

GPU和ASIC目前的優(yōu)缺點都很明顯。GPU勝在通用，能運行諸多算法，且英偉達CUDA生態(tài)成熟，具備易用性，缺點在于通用的GPU在算力和功耗上會有一定浪費。ASIC相對專用，針對特定算法的設(shè)計使算力和功耗表現(xiàn)可能更優(yōu)。以Groq的LPU為例，該公司稱LPU速度比英偉達GPU快十倍，但價格和耗電量都僅為后者的十分之一。不過，越是專用的ASIC越難容忍太多算法，原本在GPU上跑的大模型要遷移至ASIC上運行不一定容易，整體上易用性也低于GPU。

在ASIC愈來愈猛的攻勢下，兩類芯片是否即將決出勝負？或者說，資本市場對博通的看好是不是“反噬”了對英偉達的市場預(yù)期？在博通市值站上萬億美元之時，美股上周五至本周二，英偉達股價連跌三天?！澳阈枰ミ_，但我認為市場也在說，除此之外還有其他受益者?！毙磐型顿Y公司Truist聯(lián)席首席投資官基思?勒納（Keith Lerner）評論稱。不過，一些芯片業(yè)內(nèi)人士認為，GPU與ASIC之爭可以看作通用芯片與專用芯片之爭，從這個層面看，兩種芯片在一段時間之內(nèi)都有騰挪的空間，并非簡單的一方取代一方的關(guān)系。

從使用場景看，一名業(yè)內(nèi)人士告訴記者，GPU仍要用在大量并行化通用用例中，在此之外的其他需求可以使用成本更低的ASIC，例如在推理端使用低功耗的AISC。麥肯錫的研究也認為，未來AI工作量主要轉(zhuǎn)向推理，到2030年，配備ASIC芯片的AI加速器將處理大多數(shù)AI工作負載。

但具體未來ASIC能拿下多大的AI芯片市場份額，可能仍有變數(shù)，這種變數(shù)來自GPU對ASIC芯片優(yōu)點的吸收。安謀科技產(chǎn)品總監(jiān)鮑敏祺向記者表示，GPU不一定會被其他芯片取代。GPU主要在AI云端應(yīng)用，GPU更容易接入openCL cuda或者SYCL這種軟件編程生態(tài)模式，具備便利性。而從能效角度看，GPU會帶來更多的多線程上下文切換開銷，這些開銷不容忽視。由此看，未來在端側(cè)場景，GPU和其他芯片會逐步走向融合，而不是互相取代。就像英偉達H100的Tensor Core（張量處理單元）已經(jīng)引入了更多Tensor專用的技術(shù)，芯片之間已經(jīng)在取對方的長處逐步彌補自身的短處。

千芯科技董事長陳巍也認為，針對諸如能耗高等短板，GPU仍能在自身范疇內(nèi)進行改良，這種改良正是吸收了專用芯片的長處。

“GPU和其他AI芯片架構(gòu)之間，兩方面力量在博弈，新舊此消彼長。微軟、特斯拉、谷歌等已經(jīng)走向研究更專用的芯片的路線，英偉達雖然做的還是GPU，但它的路線也從原來的傳統(tǒng)GPU轉(zhuǎn)向更專用的計算結(jié)構(gòu)，其Tensor Core部分已經(jīng)明顯超過原來的CUDA Core部分。” 陳巍告訴記者。

目前已經(jīng)出現(xiàn)了越來越專門針對大模型的ASIC芯片，通過更極致的專用性提高芯片效率。例如Etched將主流大模型所基于的Transformer架構(gòu)固定在芯片Sohu上，聲稱一臺集成8塊Sohu的服務(wù)器性能匹敵160個英偉達H100 GPU。陳巍告訴記者，他猜測后續(xù)也可能出現(xiàn)針對大模型應(yīng)用的專用GPU，GPU廠商有比較高的概率會進一步改進Tensor Core結(jié)構(gòu)，從而犧牲掉一部分對顯存的支持能力。

不過，這種極致的專用性也是一把雙刃劍。另有業(yè)內(nèi)人士向記者表示，當前AI的主流架構(gòu)是Transformer，未來隨著AI架構(gòu)演進，Transformer不一定是終局，在此過程中，通用的GPU一直能被采用，但當AI主流架構(gòu)發(fā)生變化時，特別專用的ASIC芯片將無法適應(yīng)。

從這個層面看，ASIC也需要考慮舍棄通用性的風險?！埃℅PU通用性的重要性）確實如此?！?鮑敏祺告訴記者，當Transformer改變，GPU將有優(yōu)勢。以NPU為例，一方面，原本的DSA（特定領(lǐng)域架構(gòu)）可能無法應(yīng)對算法流程變化，因此對一些向量計算需要考慮引入更多通用能力。另一方面，在具備通用計算能力的情況下，芯片則可能沒有針對特定計算類型進行優(yōu)化，導(dǎo)致遇到性能瓶頸。因此設(shè)計時既要引入更多通用計算能力以適應(yīng)算法等的變化，又要平衡通用計算能力和執(zhí)行特定任務(wù)的性能。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

博通与英伟达竞逐AI芯片新格局主导者

日期： 2024-12-18

來源：第一财经

相關(guān)內(nèi)容