英偉達也于近日發(fā)布消息,由于擔心新冠病毒疫情,將原定于3月22日—26日舉行的GTC 2020大會改為網(wǎng)上舉辦。考慮到英偉達一直以來的慣例,在GTC大會上多會發(fā)布新一代計算型GPU。因此,業(yè)界預期還未露面的7nm Ampere有望面世。元大證券投資咨詢公司的一份報告指出,Ampere有望較英偉達當前采用的“圖靈”(Turing)架構(gòu)性能增加50%,同時功耗減半。Ampere GPU將面向數(shù)據(jù)中心業(yè)務。
GPU一向是英特爾的弱項,雖然不乏產(chǎn)品推出,卻一直被集成于系統(tǒng)芯片當中。然而,英特爾CFO首席財務官George Davis日前確認,2020年將會推出一款面向獨立顯卡的Xe架構(gòu)GPU。這是英特爾自1998年推出i740顯卡后,再次進軍獨顯市場。根據(jù)之前透露出來的信息,英特爾將要推出的獨立顯卡DG1,采用Xe架構(gòu),擁有96組EU執(zhí)行單元,基礎(chǔ)頻率1GHz,加速頻率1.5GHz,1MB二級緩存以及3GB顯存,TDP為25W。在DG1之后,英特爾還會發(fā)布針對高端市場的DG2獨立顯卡。
爭搶人工智能大市場
英偉達、AMD與英特爾三大芯片之所以如此積極地推進GPU的發(fā)展,與數(shù)據(jù)中心對高性能計算的需求密不可分。有專家分析指出,數(shù)據(jù)中心是人工智能深度學習最重要工作平臺,快速完成對海量數(shù)據(jù)的多層次、多迭代模型分析處理是其一項關(guān)鍵性的工作。從2011年人工智能研究人員首次使用英偉達GPU為深度學習加速之后,GPU就在人工智能領(lǐng)域發(fā)揮著巨大作用。雖然許多廠商也在開發(fā)基于FPGA或者ASIC的人工智能芯片,但目前采用GPU加速的服務器仍是數(shù)據(jù)中心的主流。
這也就使得芯片大廠不得不重視GPU的開發(fā)。2017年,英偉達推出面向數(shù)據(jù)中心業(yè)務的GPU TeslaV100 GPU,受到業(yè)界的廣泛采用。此后英偉達繼續(xù)在人工智能數(shù)據(jù)中心云端發(fā)力,研發(fā)面向不同平臺的GPU加速解決方案,今年更將推出新一代GPU架構(gòu)Ampere。研觀天下報告指出,目前人工智能應用領(lǐng)域的發(fā)展速度快于底層芯片的發(fā)展速度,GPU是目前發(fā)展最為完善的一類人工智能芯片,是現(xiàn)階段人工智能應用開發(fā)的首選。英偉達憑借其GPU的先發(fā)優(yōu)勢在人工智能的前端推理應用領(lǐng)域搶占了先機。
此前,AMD雖然也有很多GPU和顯卡產(chǎn)品,但采用的Vega核心本質(zhì)上還是一款游戲型GPU。此次,AMD發(fā)布CDNA架構(gòu),專門針對數(shù)據(jù)中心計算進行了優(yōu)化??梢钥闯?,AMD在GPU的策略上,也正在走專業(yè)化,將面向數(shù)據(jù)中心的GPU架構(gòu)與面向游戲優(yōu)化的RDNA架構(gòu)分開。
技術(shù)分析師Patrick Moorhead表示,數(shù)據(jù)中心GPU并不需要消費類顯卡的許多功能,比如顯示和像素引擎、光線追蹤等。計算型GPU通過刪除這些元素可以節(jié)省成本,同時又可添加更多有助數(shù)據(jù)中心性能提升的邏輯組件,比如張量計算單元等。不過在高性能數(shù)據(jù)中心部署CDNA 架構(gòu)GPU之前,AMD仍需在軟件上加大投入。
競爭從工藝到架構(gòu)
從技術(shù)趨勢上看,隨著數(shù)據(jù)中心深度學習對芯片處理能力以及低功耗需求的提高,GPU對制造工藝的選擇也越來越嚴苛。三大GPU公司目前基本上都選擇采用最先進的制造工藝。此前,英特爾財務官George Davis曾經(jīng)表示,針對14納米制程的產(chǎn)能不足問題,2020年將增加更多產(chǎn)能填補空缺。
面對2020年陸續(xù)推出的新品,英特爾勢必要想辦法解決先進工藝產(chǎn)能的問題。近日有消息傳出,英特爾計劃將旗下獨立顯示GPU交由臺積電6納米工藝代工。更有消息稱2022年英特爾還將采用臺積電的3納米工藝來生產(chǎn)。有業(yè)內(nèi)人士分析,假如英特真的打算擴大外包代工份額,除了已經(jīng)部分外包的芯片組之外,首先可能就是GPU,因為GPU相對CPU來說制造工藝上更為簡單,而且以往臺積電與英偉達在GPU制造上有著大量的合作,因而更有經(jīng)驗。
至于AMD方面,CDNA架構(gòu)GPU預計會在今年年底到明年年初面世,繼續(xù)采用7nm工藝。AMD沒有透露第二代CDNA 2的具體工藝,只說是更先進的節(jié)點,因而有可能采用5nm工藝。GPU也是先進工藝的追逐者。
此外,GPU在計算架構(gòu)上的革新也十分關(guān)鍵。GPU+CPU異構(gòu)架構(gòu)成為面向人工智能服務器的主流架構(gòu)。研觀天下指出,隨著數(shù)據(jù)處理復雜度的逐步提升,服務器采用的處理系統(tǒng)并非只有采用GPU,或者只采用CPU。而是由CPU和GPU組合而成的異構(gòu)系統(tǒng),兩種處理器各取所長,密集的處理任務交給GPU,復雜的邏輯運算交給CPU,兩種處理器協(xié)同工作,提升系統(tǒng)的運算速率。