123,123

云开发者正加速向Arm架构迁移

构建面向 AI 时代的未来基础设施

日期： 2026-02-03

來(lái)源：芯智讯

關(guān)鍵詞： ARM 亚马逊云谷歌微软 AI数据中心

人工智能 (AI) 正重塑數(shù)字格局，開(kāi)發(fā)者也正面臨全新挑戰(zhàn)：基礎(chǔ)設(shè)施不僅要具備強(qiáng)大算力，還需兼具可擴(kuò)展性、成本效益和高能效等特征。當(dāng)前，亞馬遜云科技、谷歌、微軟、Oracle Cloud Infrastructure (OCI) 及 NVIDIA 等超大規(guī)模云服務(wù)提供商與 AI 領(lǐng)軍企業(yè)，均已基于 Arm 架構(gòu)打造定制化解決方案，布局 AI 數(shù)據(jù)中心。

這一趨勢(shì)正在蓬勃展開(kāi)。2025 年頭部超大規(guī)模云服務(wù)提供商的新增服務(wù)器算力中，有近半數(shù)是基于 Arm 架構(gòu)。Arm Neoverse 平臺(tái)正在為量產(chǎn)級(jí) AI 工作流、向量搜索引擎、實(shí)時(shí)機(jī)器學(xué)習(xí) (ML) 平臺(tái)及云原生微服務(wù)提供算力支撐，同時(shí)在成本效益、吞吐量與節(jié)能方面實(shí)現(xiàn)可量化的顯著提升。隨著 AI 工作負(fù)載持續(xù)擴(kuò)展，基礎(chǔ)設(shè)施的選擇愈發(fā)關(guān)鍵。

AI 工作負(fù)載貫穿端到端，Arm 賦能全流程優(yōu)化

AI 的應(yīng)用早已不再局限于推理或模型訓(xùn)練環(huán)節(jié)。從數(shù)據(jù)預(yù)處理、模型編排，到實(shí)時(shí)服務(wù)與內(nèi)存管理，如今的 AI 技術(shù)棧已覆蓋整個(gè)計(jì)算工作流。這也帶來(lái)了延遲、成本、功耗及擴(kuò)展性方面的全新系統(tǒng)級(jí)挑戰(zhàn)，而這些早已超出了傳統(tǒng)通用 CPU 的設(shè)計(jì)初衷與能力范圍。

Arm 在這場(chǎng)變革中扮演核心角色——其價(jià)值不僅限于 CPU 層面，更貫穿整個(gè) AI 系統(tǒng)架構(gòu)。

在亞馬遜云科技， Arm Neoverse 核心為 Graviton 通用計(jì)算平臺(tái)、Nitro 數(shù)據(jù)處理單元 (DPU) 提供算力支撐，并作為 AI 加速器的頭節(jié)點(diǎn) (head node)，為 AI 工作流打造高度集成、能效出眾的基礎(chǔ)設(shè)施。

NVIDIA 亦采用類似架構(gòu)設(shè)計(jì)：Arm 架構(gòu)是 Grace 與 Vera CPU 的技術(shù)基石，二者均作為 AI 系統(tǒng)的頭節(jié)點(diǎn)部署；同時(shí) Arm 還為 BlueField DPU 提供算力支撐，助力數(shù)據(jù)遷移與卸載處理，為 AI 數(shù)據(jù)中心設(shè)計(jì)打造一體化的平臺(tái)解決方案。

憑借卓越的每瓦性能、強(qiáng)大的內(nèi)存帶寬，以及在 Amazon Graviton、Google Cloud Axion、Microsoft Azure Cobalt、NVIDIA Grace 等平臺(tái)上的規(guī)?；渴?，基于 Arm 架構(gòu)的基礎(chǔ)設(shè)施正日益成為可擴(kuò)展、高性價(jià)比 AI 工作負(fù)載的優(yōu)選方案。

Arm 正成為云計(jì)算的新標(biāo)準(zhǔn)

云計(jì)算領(lǐng)域正經(jīng)歷一場(chǎng)戰(zhàn)略性轉(zhuǎn)變：全球領(lǐng)先的云服務(wù)提供商均在加碼基于 Arm 架構(gòu)的基礎(chǔ)設(shè)施建設(shè)，將其作為融合型 AI 數(shù)據(jù)中心規(guī)?；渴鸬哪J(rèn)路徑。這并非試點(diǎn)探索，而是著眼于長(zhǎng)期的架構(gòu)戰(zhàn)略。

在軟件層面，Atlassian、Spotify 和優(yōu)步 (Uber) 等企業(yè)，已開(kāi)始借助通用工具與社區(qū)文檔，將核心工作負(fù)載遷移至基于 Arm 架構(gòu)的云基礎(chǔ)設(shè)施，且無(wú)需對(duì)底層平臺(tái)進(jìn)行深度重構(gòu)。Atlassian 表示，在將核心服務(wù)遷移至 Arm 實(shí)例后，計(jì)算成本顯著降低，CI/CD 工作流運(yùn)行速度也得到提升；Spotify 在后端工作負(fù)載中試用 Graviton 平臺(tái)后，實(shí)現(xiàn)了顯著的基礎(chǔ)設(shè)施效率提升；Uber 則通過(guò)基于 Arm 架構(gòu)的基礎(chǔ)設(shè)施，在優(yōu)化微服務(wù)性能的同時(shí)，降低了單實(shí)例的運(yùn)營(yíng)成本。

與此同時(shí)，Arm 提供的一系列工具正加速這一遷移進(jìn)程。例如 Arm MCP（模型上下文協(xié)議）服務(wù)器以及集成于 GitHub Copilot 的 Arm 云遷移智能體 (Cloud Migration Agent)，正幫助開(kāi)發(fā)者評(píng)估工作負(fù)載兼容性、加快云遷移進(jìn)程，并實(shí)現(xiàn)穩(wěn)定可靠的規(guī)?；渴?。目前，專為各類 Arm 云平臺(tái)量身打造的 Arm MCP 服務(wù)器已面向所有軟件開(kāi)發(fā)者開(kāi)放，它可將云遷移工具與專業(yè)經(jīng)驗(yàn)直接融入開(kāi)發(fā)者常用的 AI 助手中，從而賦能自主化的智能體工作流。

通過(guò)自動(dòng)化最佳實(shí)踐、加速開(kāi)發(fā)流程并提供實(shí)時(shí)指導(dǎo)，該工具顯著簡(jiǎn)化了遷移路徑，讓開(kāi)發(fā)團(tuán)隊(duì)從項(xiàng)目首日起，即可更輕松地獲得成本、能效與性能優(yōu)勢(shì)。早期用戶的反饋也驗(yàn)證了其在真實(shí)遷移場(chǎng)景中具備高度實(shí)用性。

開(kāi)發(fā)者轉(zhuǎn)向 Arm 架構(gòu)的五大案例

除上述全球軟件企業(yè)外，其他科技公司在日常運(yùn)營(yíng)中采用基于 Arm 架構(gòu)的云基礎(chǔ)設(shè)施時(shí)，也收獲了類似效益。

借助 Graviton3，LLM推理成本降低 35%

Vociply AI 是一家專注于大規(guī)模部署大語(yǔ)言模型 (LLM) 的 AI 初創(chuàng)企業(yè)，在切換至 Amazon Graviton3 后，其月度基礎(chǔ)設(shè)施成本從 2000 美元降至 1300 美元，同時(shí)性能實(shí)現(xiàn)同步提升，具體包括：

· 性價(jià)比提升 40%

· 詞元(token) 吞吐量提升6%

· 功耗降低23%

· 這一成果得益于 Arm Neoverse 核心、Neon? 指令集深度優(yōu)化，以及 llama.cpp 等量化推理引擎的支持。

生成式 AI 工作流提速，基礎(chǔ)設(shè)施成本降低 40%

生成式 IT 及 AI 解決方案平臺(tái) Esankethik 將其完整技術(shù)棧——涵蓋預(yù)處理、訓(xùn)練與推理環(huán)節(jié)，全面遷移至基于 Arm 架構(gòu)的 Graviton 實(shí)例，取得了顯著成效，具體包括：

· 推理業(yè)務(wù)延遲降低 25%

· 每百萬(wàn)次請(qǐng)求的 Lambda 成本降低 40%

· 內(nèi)存效率提升 15%

· 通過(guò)在 Arm 平臺(tái)上統(tǒng)一運(yùn)行預(yù)處理、訓(xùn)練與推理任務(wù)，Esankethik 有效緩解了性能瓶頸，并顯著提升了系統(tǒng)可擴(kuò)展性。

SiteMana 實(shí)現(xiàn)實(shí)時(shí)ML 的穩(wěn)定規(guī)?；?/strong>

獲客技術(shù)公司 SiteMana 已將其實(shí)時(shí) ML 推理與數(shù)據(jù)攝取任務(wù)遷移至 Graviton3 平臺(tái)，并取得了顯著成效：

· 月度成本降低約 25%

· P95 延遲降低約 15%

· 網(wǎng)絡(luò)帶寬提升5 倍

· 此次遷移有效解決了 CPU 降頻問(wèn)題，并實(shí)現(xiàn)了峰值負(fù)載下的系統(tǒng)性能穩(wěn)定。

AuthZed 提升開(kāi)發(fā)者工作流效率

AuthZed 作為基礎(chǔ)設(shè)施服務(wù)授權(quán)平臺(tái)，已將其從開(kāi)發(fā)筆記本到云端的所有工作負(fù)載統(tǒng)一遷移至 Arm 架構(gòu)，由此實(shí)現(xiàn)了：

· 本地構(gòu)建速度提升 40%

· 生產(chǎn)環(huán)境 CPU 利用率提升20%–25%

· 計(jì)算成本降低約 20%

· 該方案在不改變開(kāi)發(fā)者既有工作習(xí)慣的前提下，實(shí)現(xiàn)了工作流程的大幅精簡(jiǎn)優(yōu)化。

Zilliz Cloud 提升 AI 搜索吞吐量

面向生產(chǎn)級(jí) AI 應(yīng)用的全托管向量數(shù)據(jù)庫(kù)平臺(tái) Zilliz Cloud，將其向量搜索引擎遷移至 Graviton3 后，實(shí)現(xiàn)了以下優(yōu)化成果：

· 索引構(gòu)建性能提升 50%

· 十億級(jí)查詢場(chǎng)景下，向量搜索速度提升 20%

· 單查詢成本降低，吞吐量提升

· 該成果適用于語(yǔ)義搜索、檢索增強(qiáng)生成 (RAG) 及多模態(tài) AI 任務(wù)。

為 AI 云時(shí)代而生

Arm Neoverse 專為現(xiàn)代工作負(fù)載打造——涵蓋 LLM、向量搜索、實(shí)時(shí) ML、數(shù)據(jù)分析及高密度微服務(wù)等場(chǎng)景。與 x86 相比，基于 Arm 的實(shí)例具備以下優(yōu)勢(shì)：

· 更卓越的性價(jià)比優(yōu)勢(shì)

· 更出色的 AI 與云原生工作負(fù)載性能

· 成熟的軟件生態(tài)與完善的開(kāi)發(fā)者工具鏈

· 通過(guò) Arm KleidiAI 為 AI 框架提供優(yōu)化支持，實(shí)現(xiàn)無(wú)縫性能調(diào)優(yōu)與集成

Arm 提供涵蓋開(kāi)發(fā)者資源、性能調(diào)優(yōu)指南與云遷移清單在內(nèi)的完整套件，顯著簡(jiǎn)化 AI 與云工作負(fù)載的遷移流程。這些資源可降低遷移阻力，支持性能調(diào)優(yōu)，且無(wú)需對(duì)平臺(tái)進(jìn)行全面重構(gòu)。

開(kāi)發(fā)者可通過(guò) Arm 云遷移計(jì)劃獲取遷移資源、技術(shù)指南及專家咨詢服務(wù)。

此外，Arm MCP Server 現(xiàn)已向所有開(kāi)發(fā)者開(kāi)放，可幫助識(shí)別并高效執(zhí)行從 x86 到 Arm 架構(gòu)的遷移。開(kāi)發(fā)者可點(diǎn)擊此處，訪問(wèn) Arm MCP Server。

AI 時(shí)代的基礎(chǔ)設(shè)施平臺(tái)

基于 Arm 的云基礎(chǔ)設(shè)施正快速成為 AI 計(jì)算戰(zhàn)略的基石。

隨著工作負(fù)載持續(xù)擴(kuò)展，能效的重要性日益凸顯，基礎(chǔ)設(shè)施需以更少資源提供更多價(jià)值。Arm 為打造下一代 AI 系統(tǒng)的開(kāi)發(fā)者，提供了切實(shí)可行的實(shí)踐路徑。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

云开发者正加速向Arm架构迁移

日期： 2026-02-03

來(lái)源：芯智讯

相關(guān)內(nèi)容