《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 亞馬遜AWS推出基于英特爾AI加速器的EC2實例,性價比提升40%

亞馬遜AWS推出基于英特爾AI加速器的EC2實例,性價比提升40%

2020-12-09
來源:芯智訊
關(guān)鍵詞: 亞馬遜AWS 英特爾 EC2實例

  在近日舉行的AWS re:Invent 2020(亞馬遜 re:Invent 2020)大會上,AWS首席執(zhí)行官Andy Jassy宣布了采用最多8個Habana? Gaudi?加速器的EC2實例。對于機器學(xué)習(xí)工作負載,這些全新EC2實例的性價比相較目前基于GPU的EC2實例提升高達40%。Gaudi加速器專為訓(xùn)練深度學(xué)習(xí)模型而設(shè)計,適用于自然語言處理、對象檢測和機器學(xué)習(xí)訓(xùn)練、分類、推薦以及個性化等工作負載。據(jù)介紹,基于Gaudi?的EC2實例計劃于2021年上半年提供使用。

微信圖片_20201209145933.jpg

  △圖中顯示為Habana Labs的HL-205 Gaudi夾層卡?;贕audi的EC2實例可提供卓越的成本效益和高性能,且同時原生支持TensorFlow、 PyTorch等通用框架。(圖片來源:Habana Labs)

  在主題大會上,AWS首席執(zhí)行官Andy Jassy強調(diào)了各行業(yè)對高性能、更實惠的人工智能工作的巨大需求。隨著公司計劃引入以Gaudi為特色的新EC2實例進行深度學(xué)習(xí)訓(xùn)練,AWS將進一步降低AI數(shù)據(jù)集的訓(xùn)練成本,并降低希望利用AI提供業(yè)務(wù)分析、改善效率和增強用戶體驗的客戶的運營總成本。

  8卡的Gaudi 解決方案可以在TensorFlow上每秒處理12000張圖像訓(xùn)練ResNet-50模型。每個Gaudi處理器集成了32GB的HBM2內(nèi)存,并集成了用于服務(wù)器內(nèi)部處理器互聯(lián)的RoCE功能。憑借AWS彈性架構(gòu)適配器(EFA)的技術(shù)可以跨服務(wù)器擴展,從而允許AWS及其客戶無縫地擴展使用多個基于Gaudi的系統(tǒng)以實現(xiàn)高效和可擴展的分布式訓(xùn)練。

  Habana的SynapseAI軟件套件專為在Habana Gaudi處理器上提供高性能的深度學(xué)習(xí)訓(xùn)練,SynapseAI與TensorFlow和Pythorch等流行的深度學(xué)習(xí)框架集成,對Gaudi進行了優(yōu)化。開發(fā)人員將可以獲取開放的Gaudi軟件、參考模型和文檔。參考模型將在Habana的GitHub知識庫中公開發(fā)布,并將包括各種流行的模型,如圖像分類、對象檢測、自然語言處理和推薦系統(tǒng)。SynapseAI軟件套件包括Habana的圖形編譯器和實時Tensor Processor Core (TPC)內(nèi)核庫、固件和驅(qū)動程序,以及用于定制內(nèi)核開發(fā)的TPC SDK和SynapseAI Profiler等開發(fā)工具。

  英特爾公司旗下Habana Labs首席執(zhí)行官David Dahan表示:“我們?yōu)锳WS選擇Habana Gaudi處理器用于其即將推出的EC2訓(xùn)練實例感到自豪。Habana團隊期待繼續(xù)與AWS展開合作,為客戶持續(xù)提供確保連續(xù)性及先進性的產(chǎn)品路線圖?!?/p>

  重要性:作為全球領(lǐng)先的云服務(wù)提供商,AWS被全球各地的開發(fā)者用于訓(xùn)練其人工智能模型。然而,機器學(xué)習(xí)模型復(fù)雜程度的增加推升了訓(xùn)練所需的時間和成本,特別是在越來越多的數(shù)據(jù)可用、且開發(fā)者尋求改進其模型的情況下。基于Gaudi的EC2實例旨在通過交付高成本效益及高性能,并同時原生支持TensorFlow和PyTorch等通用框架,來滿足這些需求。借助Habana的SynapseAI軟件套件,開發(fā)者將能夠輕松地構(gòu)建新的訓(xùn)練模型或?qū)F(xiàn)有訓(xùn)練模型從GPU移植到Gaudi加速器。

  英特爾的人工智能和XPU愿景:英特爾在2019年收購了Habana,并借此推進其人工智能戰(zhàn)略,加強其面向云和數(shù)據(jù)中心的人工智能加速器產(chǎn)品組合。這包含一系列支持商業(yè)、社會及科研領(lǐng)域最具前景的人工智能應(yīng)用場景的產(chǎn)品和技術(shù)。這也體現(xiàn)了公司面向提供全面的跨CPU、GPU、FPGA等的XPU架構(gòu)并以此幫助客戶和整個生態(tài)系統(tǒng)釋放數(shù)據(jù)潛能的轉(zhuǎn)型。

  英特爾數(shù)據(jù)平臺事業(yè)部首席戰(zhàn)略官Remi El-Ouazzane表示:“我們的產(chǎn)品組合反應(yīng)了人工智能并非是能用一種解決方案來滿足所有場景的計算挑戰(zhàn)。云服務(wù)提供商目前已廣泛采用了內(nèi)置人工智能性能的英特爾?至強?處理器來應(yīng)對人工智能推理工作負載。通過Habana,我們現(xiàn)在得以幫助他們降低人工智能模型的大規(guī)模訓(xùn)練成本,在高增長的市場機遇中提供極富競爭力的替代選擇。”

  資料顯示,Habana Labs公司總部位于以色列,是一家為數(shù)據(jù)中心提供可編程深度學(xué)習(xí)加速器的廠商。美國當?shù)貢r間2019年12月16日,英特爾公司宣布以20億美元收購了Habana Labs,旨在將增強英特爾的人工智能產(chǎn)品組合,并加快其在快速增長的人工智能芯片新興市場的發(fā)展。

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。