隨著人工智能熱潮的繼續(xù)推進(jìn),英偉達(dá)很可能失去如今的主導(dǎo)地位,因?yàn)樵絹碓蕉嗟拇笮蛿?shù)據(jù)中心運(yùn)營商為降低成本,正在采購定制芯片(ASIC),這將讓英偉達(dá)的通用型芯片“跌落云端”。
研究公司Counterpoint在一份報(bào)告中指出,博通預(yù)計(jì)將在2027年繼續(xù)保持其作為頂級(jí)AI服務(wù)器計(jì)算ASIC設(shè)計(jì)合作伙伴的領(lǐng)先地位,市場(chǎng)份額進(jìn)一步擴(kuò)大至60%。
與此同時(shí),與博通合作緊密的臺(tái)積電也將快速擴(kuò)張。作為定制芯片的主要代工選擇,該公司幾乎完全吃下全球前十大數(shù)據(jù)中心及ASIC客戶的晶圓制造訂單,市場(chǎng)份額接近99%。
Counterpoint由此預(yù)測(cè),在英偉達(dá)通用型GPU獨(dú)占鰲頭的階段之后,人工智能芯片熱潮的第二階段將變成ASIC與GPU的激烈競爭,且博通和臺(tái)積電有望成為最大贏家。
ASIC與GPU
英偉達(dá)GPU的核心優(yōu)勢(shì)是大規(guī)模并行計(jì)算能力,適合處理矩陣乘法、卷積運(yùn)算等人工智能任務(wù)。但隨著數(shù)據(jù)中心投入和能耗問題的不斷加劇,各大數(shù)據(jù)中心所有公司正在思考更加高效簡約,且符合自身需求的解決方案。
如博通為谷歌設(shè)計(jì)的TPU,其核心是脈動(dòng)陣列架構(gòu),專注于矩陣乘法等張量運(yùn)算,其能效比是英偉達(dá)H100的2到3倍,而推理成本則低30%至40%。高盛分析師James Schneider指出,TPU技術(shù)從v6發(fā)展到v7還將幫助每個(gè)token的成本下降70%。
亞馬遜的Trainium芯片也在推理成本上有優(yōu)勢(shì),相較于H100低30%至40%,其單位算力成本是H100的60%,推理吞吐量則比H100高25%,
另一家設(shè)計(jì)公司Marvell則與微軟合作了Maia芯片。Marvell曾經(jīng)也與亞馬遜合作了Trainium 2的項(xiàng)目,但由于表現(xiàn)不佳失去了Trainium 3的設(shè)計(jì)合約,另一家臺(tái)灣公司Alchip最后參與了Trainium 3的開發(fā)。
這也讓Marvell的處境有些尷尬,其此前被視為博通的主要挑戰(zhàn)者,但目前卻面臨設(shè)計(jì)訂單增長受阻的困境。Counterpoint估計(jì),即使Marvell的總出貨量持續(xù)增長,其設(shè)計(jì)服務(wù)市場(chǎng)份額到2027年仍可能下滑至8%。
相比于ASIC設(shè)計(jì)領(lǐng)域中尚有懸念的競爭,臺(tái)積電的成功則確定性更強(qiáng),因?yàn)闊o論是GPU還是ASIC,臺(tái)積電都是下游壟斷性的制造廠商。
不過,高盛的Schneider指出,定制芯片雖然在成本上更具優(yōu)勢(shì),但英偉達(dá)的CUDA軟件仍然是其維護(hù)企業(yè)客戶的關(guān)鍵護(hù)城河。CUDA是英偉達(dá)推出的通用并行計(jì)算平臺(tái),覆蓋全球95%以上的AI開發(fā)者。
業(yè)內(nèi)預(yù)期,未來幾年市場(chǎng)更可能是ASIC和GPU并存的局面,現(xiàn)在仍無法斷言哪種策略會(huì)被最終淘汰。

