當(dāng)前,隨著人工智能/機(jī)器學(xué)習(xí)(AI/ML)的極速興起,智能技術(shù)正被廣泛應(yīng)用于制造業(yè)、交通、醫(yī)療、教育和金融等各個領(lǐng)域,人工智能將掀起下一次工業(yè)革命。
中國作為全球人工智能發(fā)展最快的國家之一,正備受矚目。根據(jù)德勤最新發(fā)布的統(tǒng)計預(yù)測數(shù)據(jù)顯示,2020年全球人工智能市場規(guī)模將達(dá)到6800億元人民幣,復(fù)合增長率(CAGR)達(dá)26%。而中國人工智能市場的表現(xiàn)尤為突出,到2020年市場規(guī)模預(yù)計將達(dá)到710億元人民幣,自2015年至2020年,五年間的復(fù)合增長率高達(dá)44.5%。
近年來,中國正在積極推動人工智能與實(shí)體經(jīng)濟(jì)的融合,從而實(shí)現(xiàn)產(chǎn)業(yè)的優(yōu)化升級。2017年7月,國務(wù)院印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,這一規(guī)劃與2015年5月發(fā)布的《中國制造2025》共同構(gòu)成了中國人工智能戰(zhàn)略的核心。這份具有里程碑意義的規(guī)劃,對人工智能發(fā)展進(jìn)行了戰(zhàn)略性部署,力爭到2030年把中國建設(shè)成為世界主要人工智能創(chuàng)新中心。此外,2020年是中國的新基建元年,而人工智能作為一大重點(diǎn)板塊,勢必成為新基建的核心支撐。
在此背景下, 中國人工智能產(chǎn)業(yè)規(guī)模在2019年末達(dá)到510億元人民幣,其中人工智能企業(yè)超過2600家。隨著中國加速推進(jìn)人工智能應(yīng)用以引領(lǐng)經(jīng)濟(jì)增長,這一趨勢將推動計算機(jī)硬件和軟件各方面的快速發(fā)展。
Rambus在最新發(fā)布的白皮書中探討了內(nèi)存帶寬對AI/ML的重要作用,特別介紹了HBM2E和GDDR6內(nèi)存優(yōu)勢和設(shè)計注意事項(xiàng)。白皮書還解釋了每種內(nèi)存在整個AI/ML架構(gòu)中的適用性,以及如何利用Rambus HBM2E和GDDR6接口解決方案來實(shí)現(xiàn)一個完整的內(nèi)存子系統(tǒng)。以下是白皮書的一些重要內(nèi)容:
AI/ML步入高速發(fā)展期
作為AI/ML的關(guān)鍵應(yīng)用場景,訓(xùn)練與推理能力的發(fā)展,從某種程度上代表著人工智能的高速發(fā)展。從2012年到2019年,人工智能訓(xùn)練集增長了30萬倍,要求人工智能計算機(jī)硬件和軟件的各個方面都需要不斷的快速改進(jìn)。與此同時,人工智能推理正在網(wǎng)絡(luò)邊緣和廣泛的物聯(lián)網(wǎng)設(shè)備中采用,包括在汽車/ADAS中。
支持這一發(fā)展速度需要的遠(yuǎn)不止摩爾定律所能實(shí)現(xiàn)的改進(jìn),摩爾定律在任何情況下都在放緩,這就要求人工智能計算機(jī)硬件和軟件的各個方面都需要不斷的快速改進(jìn)。
內(nèi)存帶寬是影響AI發(fā)展的關(guān)鍵因素
內(nèi)存帶寬將成為人工智能持續(xù)增長的關(guān)鍵焦點(diǎn)領(lǐng)域之一。以先進(jìn)的駕駛員輔助系統(tǒng)(ADAS)為例,第3級及更高級別系統(tǒng)的復(fù)雜數(shù)據(jù)處理需要超過200 GB/s的內(nèi)存帶寬。這些高帶寬是復(fù)雜的AI/ML算法的基本需求,在道路上自駕過程中這些算法需要快速執(zhí)行大量計算并安全地執(zhí)行實(shí)時決策。在第5級,即完全自主駕駛,車輛能夠獨(dú)立地對交通標(biāo)志和信號的動態(tài)環(huán)境作出反應(yīng),以及準(zhǔn)確地預(yù)測汽車、卡車、自行車和行人的移動,將需要超過500GB/s的內(nèi)存帶寬。
隨著新一代AI/ML加速器和專用芯片的快速發(fā)展,新的內(nèi)存解決方案,如高帶寬內(nèi)存(HBM、HBM2、HBM2E)和GDDR6 SDRAM(GDDR6)漸被采用來提供所需的帶寬。
HBM2E和GDDR6助力新一輪人工智能應(yīng)用浪潮
鑒于AI/ML的需求分流的特性,內(nèi)存的選擇取決于應(yīng)用:訓(xùn)練還是推理。HBM2E和GDDR6這兩種高帶寬內(nèi)存,都可以起到至關(guān)重要的作用。
對于訓(xùn)練來說,帶寬和容量是至關(guān)重要的需求。特別是考慮到訓(xùn)練集的規(guī)模正以每3.43個月翻一番的速度增長。此外,在數(shù)據(jù)中心運(yùn)行的訓(xùn)練應(yīng)用程序因電源和空間所致的限制越來越大,因此有一個提供更佳能效和更小尺寸的解決方案是一大加分??紤]到所有這些需求,HBM2E是AI訓(xùn)練硬件的理想內(nèi)存解決方案。
在推理的情況下,帶寬和延遲對于實(shí)時操作的需求至關(guān)重要。對于人工智能推理這一日益具有挑戰(zhàn)性的領(lǐng)域,GDDR6是一個理想的解決方案。建立在成熟的制造工藝基礎(chǔ)上,其出色的性價比使其適合廣泛的采用。
Rambus提供全面且現(xiàn)成的HBM2E和GDDR6內(nèi)存接口解決方案,可集成到AI/ML訓(xùn)練和推理SoCs中。最近,該公司的 HBM2E內(nèi)存接口解決方案實(shí)現(xiàn)了創(chuàng)紀(jì)錄的4 Gbps性能。該解決方案由完全集成的PHY和控制器組成,搭配業(yè)界最快的,來自SK hynix的3.6Gbps運(yùn)行速度的HBM2E DRAM,該解決方案可以從單個HBM2E設(shè)備提供460 GB/s的帶寬。此性能可以滿足TB級的帶寬需求,針對最苛刻和最先進(jìn)的AI/ML訓(xùn)練和高性能的加速器計算(HPC)應(yīng)用而生。
總的來說,訓(xùn)練和推理有其獨(dú)特的應(yīng)用需求,可以通過定制內(nèi)存解決方案來支持。HBM2E是AI訓(xùn)練的理想選擇,GDDR6是AI推理的理想選擇。設(shè)計師可以通過與Rambus合作來克服這些架構(gòu)中固有的設(shè)計挑戰(zhàn),從而實(shí)現(xiàn)這些高性能內(nèi)存的長處。