微軟希望通過推出用于AI和其他工作負載的新型專用芯片來推動其客戶的AI和云計算雄心。
近日舉行的Ignite 2023大會上,微軟宣布的新芯片包括微軟在Azure上推出的首款定制型AI加速器Azure Maia,旨在支持大型語言模型和GitHub Copilot等工作負載,以及微軟首個定制的自主開發(fā)型CPU——Azure Cobalt,該芯片是基于Arm架構(gòu)構(gòu)建的,可為常見工作負載提供最佳性能和能源效率。
微軟Azure基礎(chǔ)設(shè)施營銷總經(jīng)理Omar Khan在一篇博文中表示,AI轉(zhuǎn)型是今年Ignite大會的核心主題之一。他表示,今年人工智能發(fā)展迅速,正在推動著一波創(chuàng)新浪潮,迅速改變應(yīng)用格局以及應(yīng)用構(gòu)建和交付的方式。然而,企業(yè)在努力發(fā)展這一創(chuàng)新的同時,還要應(yīng)對成本上升和可持續(xù)發(fā)展挑戰(zhàn)等優(yōu)先事項。
Khan表示:“如今客戶正在尋找能夠滿足他們所有需求的AI解決方案,在AI新時代,我們正在重新定義從芯片到系統(tǒng)的云基礎(chǔ)設(shè)施,為每個企業(yè)、每個應(yīng)用和每個人的AI做好準備?!?/p>
Azure Maia定制AI加速器
Khan解釋說,Azure Maia加速器芯片是為大型語言模型、Bing和ChatGPT等AI工作負載定制的,是計劃中的第一代加速器系列,它擁有1050億個晶體管,是有史以來基于5納米工藝制造的最強大的芯片之一。該芯片是微軟與OpenAI合作設(shè)計的,OpenAI深入了解了其大型語言模型如何運行在Azure云基礎(chǔ)設(shè)施上,以確保其提供最佳性能。
OpenAI首席執(zhí)行官Sam Altman表示,OpenAI的專家和微軟在Azure AI基礎(chǔ)設(shè)施層的各個方面進行了合作。他說:“我們共同努力,用我們的模型來完善和測試,Azure端到端的AI架構(gòu)現(xiàn)在已經(jīng)通過Maia優(yōu)化至芯片,為訓(xùn)練功能更強大的模型、為客戶降低這些模型的成本鋪平了道路?!?/p>
微軟技術(shù)研究員Brian Harry表示,Maia 100 AI加速器也是專門為適應(yīng)Azure硬件堆棧的其余部分而構(gòu)建的。他承諾,該芯片的設(shè)計與Azure更大的AI基礎(chǔ)設(shè)施的結(jié)合,將帶來性能和效率上的巨大提升。
Azure Cobalt CPU
Cobalt CPU是一款64位的128核芯片,據(jù)稱比當(dāng)前一代Azure Arm芯片性能提高了40%,旨在為Teams和Azure SQL等微軟服務(wù)提供支持。Arm芯片以其節(jié)能設(shè)計而聞名,可以幫助客戶實現(xiàn)可持續(xù)發(fā)展的目標,同時確保云原生應(yīng)用按預(yù)期運行,其重點是優(yōu)化芯片的每瓦性能,以便在消耗的每單位能量中榨取最大功率。
Harry表示:“架構(gòu)和實施的設(shè)計考慮了功效,我們正在以最有效的方式利用硅上的晶體管,將我們所有數(shù)據(jù)中心服務(wù)器的效率提升相乘,加起來就是一個相當(dāng)大的數(shù)字?!?/p>
Azure硬件系統(tǒng)和基礎(chǔ)設(shè)施公司副總裁Rani Borkar表示,微軟選擇自主設(shè)計自己的芯片,以確保芯片完美適合其云基礎(chǔ)設(shè)施及其運行的AI工作負載。這些芯片將與定制的服務(wù)器主板集成,并放置在定制的服務(wù)器機架內(nèi),以便輕松安裝在微軟的數(shù)據(jù)中心內(nèi),然后將配合微軟專門設(shè)計的數(shù)據(jù)中心軟件使用。Borkar表示,其結(jié)果就是讓硬件系統(tǒng)提供最大的靈活性,可以針對功耗、性能、可持續(xù)性或成本進行優(yōu)化。
Borkar表示:“在微軟,我們正在共同設(shè)計和優(yōu)化硬件和軟件,以便實現(xiàn)一加一大于二的效果。我們可以看到整個堆棧,而硅只是其中的成分之一?!?/p>
Khan表示,新的芯片代表了微軟下一代云基礎(chǔ)設(shè)施的最后一塊版圖,將于明年初開始向客戶推出,最初將支持包括Microsoft Copilot和Azure OpenAI Service在內(nèi)的服務(wù),然后擴展到其他類型的工作負載。
Constellation Research分析師Holger Mueller表示,微軟針對AI開發(fā)自己的定制硬件是有意義的,因為微軟已經(jīng)提供了一系列用于開發(fā)和運行這些工作負載的最全面的軟件。他說:“性能和功能的結(jié)合,再加上Azure的網(wǎng)絡(luò)功能,使這些定制芯片成為企業(yè)非常感興趣的產(chǎn)品,企業(yè)將非常高興看到Azure Maia和Azure Cobalt能夠提供什么?!?/p>
除了新硬件之外,微軟還做出了巨大努力來改善連接硬件的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。微軟表示,憑借其中空芯光纖技術(shù)和現(xiàn)已全面推出的Azure Boost服務(wù),將能夠大幅加速網(wǎng)絡(luò)和存儲,兩者的結(jié)合將使客戶能夠?qū)崿F(xiàn)高達每秒12.5 GB的吞吐量、每秒650000 IPOS的遠程存儲性能、以及高達每秒200 GB的網(wǎng)絡(luò)帶寬,以支持數(shù)據(jù)最密集的工作負載。
除了微軟的定制芯片之外,客戶還將擁有新的硬件選擇。微軟在另一份聲明中表示,正在與Nvidia公司合作,提供對其最新基于H100 Tensor Core GPU的虛擬機的訪問了路徑,主要針對中型到大型的AI工作負載例如Azure Confidential虛擬機,還將于明年提供對Nvidia H200 Tensor Core GPU的訪問,以盡可能低的延遲支持對更大型AI模型的推理。
第三個AI工作負載選擇是由AMD構(gòu)建的新型MI300加速器。MI300于今年早些時候發(fā)布,并將于明年初在Azure上提供。微軟表示,這款高性能芯片的加入為客戶提供了運行AI應(yīng)用的更多選擇。
Borkar表示:“以客戶為中心意味著我們?yōu)榭蛻籼峁┳詈玫臇|西,意味著我們要利用生態(tài)系統(tǒng)中可用的東西以及我們開發(fā)的東西,我們將繼續(xù)與所有合作伙伴合作,為客戶提供他們想要的東西。”
Azure基礎(chǔ)架構(gòu)更新
微軟在Azure基礎(chǔ)設(shè)施方面還有更多內(nèi)容可以分享,例如微軟宣布Oracle Database@Azure服務(wù)將在微軟美國東部Azure區(qū)域全面上線。該服務(wù)將于12月推出,該地區(qū)的Azure客戶可以直接訪問Oracle自己數(shù)據(jù)中心的Oracle云基礎(chǔ)設(shè)施上的數(shù)據(jù)庫服務(wù)。微軟承諾,將與Oracle Exadata Database Service on OCI的性能、規(guī)模和工作負載可用性相匹配,同時添加Azure的所有優(yōu)勢包括安全性、靈活性和服務(wù)。
與此同時,VMware的客戶很快將能夠訪問VMware vSphere on Azure Arc。該服務(wù)現(xiàn)已全面推出,融合了Azure和VMware的基礎(chǔ)設(shè)施,為開發(fā)者提供支持讓他們可以使用Azure 的服務(wù)構(gòu)建更復(fù)雜的應(yīng)用。此外,由Azure Arc支持的Azure IoT Operations現(xiàn)在也已經(jīng)推出預(yù)覽版,這樣客戶就可以構(gòu)建復(fù)雜性較低的物聯(lián)網(wǎng)應(yīng)用和服務(wù),使遠程設(shè)備能夠在AI洞察的驅(qū)動下做出實時決策。
最后,微軟分享了Microsoft Copilot for Azure的一些簡要細節(jié),該產(chǎn)品今天推出了預(yù)覽版。Microsoft Copilot for Azure基于生成式AI技術(shù),使客戶能夠更輕松地在Azure中執(zhí)行多種任務(wù),將簡化用戶在任何環(huán)境中設(shè)計、操作應(yīng)用和基礎(chǔ)設(shè)施以及對其進行故障排除的方式??蛻艨梢栽谠摲?wù)正式推出之前申請訪問。