八月初秋,天氣一如既往的火熱。南國深圳,華為坂田基地更是一番熱火朝天的景象。三天前,華為輪值主席徐直軍在這里推出華為高端 AI 芯片昇騰 910 ,開啟華為在先進技術(shù)領(lǐng)域挑戰(zhàn)硅谷的最新嘗試。
一直以來,華為自研芯片都是人們關(guān)注的焦點。,正是因為有了自主研發(fā)的海思麒麟系列手機芯片,華為才能快速搶占手機市場,一路“攻城略地”,躋身中國智能手機行業(yè)第一寶座。當(dāng)然,作為目前全球體量最大的通信設(shè)備商、全球坐三望二的智能手機廠商,華為自研芯片不止于此。巴龍、鯤鵬、凌霄還有這次發(fā)布會重點推出的昇騰,華為自研芯片已經(jīng)覆蓋手機、服務(wù)器、路由器,電視、AI 等多個領(lǐng)域。自研芯片已然成為華為的核心競爭力,一個其他競爭對手所不具備的獨特優(yōu)勢。
昇騰系列芯片主打人工智能領(lǐng)域,用于處理構(gòu)建人工智能算法的海量數(shù)據(jù)。華為的這次公布,讓不少人沸騰了,網(wǎng)上的言論越傳越神,被稱作“攻破了又一個讓國人蒙羞的城池”,“實現(xiàn)了彎道超車”,甚至出現(xiàn)了華為將在云端 AI 芯片領(lǐng)域干掉英偉達、谷歌的論斷。這些評價是否正確?華為昇騰芯片真的有那么大影響力嗎?
江湖霸主英偉達
AI 芯片是什么,半導(dǎo)體業(yè)界并沒有嚴格的界定。一般來說,AI 芯片被稱為 AI 加速器或計算卡,也就是 AI 應(yīng)用中的大量計算任務(wù)的模塊,目前主要有 GPU、FPGA 和 ASIC 三種技術(shù)路線。其中 GPU 在 AI 訓(xùn)練方面已經(jīng)發(fā)展到較為成熟的階段,谷歌、臉書、微軟、 推特和百度等公司都在使用 GPU 分析圖片、視頻和音頻文件,以實現(xiàn)深度學(xué)習(xí)等功能。
看到這里,很多人心里納悶, GPU 不是顯示芯片么,怎么用來搞 AI 。其實這個道理很簡單,GPU 負責(zé)處理圖形數(shù)據(jù)處理,擁有大體量的邏輯運算單元用于數(shù)據(jù)處理,對于密集型數(shù)據(jù)可以進行并行處理。人工智能的神經(jīng)網(wǎng)絡(luò)架構(gòu)有個特征,剛算出來的數(shù)往往再投入結(jié)算,一輪輪迭代以凸顯關(guān)鍵細節(jié),這種計算不需要太多數(shù)據(jù)緩存單元,不需要復(fù)雜的邏輯控制,只要計算單元夠多就行。相比注重邏輯判斷的 CPU ,GPU 芯片顯然更加適用于人工智能深度計算。
在 GPU 芯片領(lǐng)域,英偉達是當(dāng)之無愧的龍頭老大。在人工智能興起之初,由于 GPU 芯片在深度學(xué)習(xí)領(lǐng)域的優(yōu)勢,英偉達與斯坦福大學(xué)的吳恩達合作開發(fā)了一種使用大規(guī)模GPU計算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法。與此同時,英偉達與谷歌的人工智能團隊合作,建造了當(dāng)時最大的人工神經(jīng)網(wǎng)絡(luò)。之后,各深度學(xué)習(xí)團隊開始廣泛大批量使用英偉達的顯卡。
如今,全球估計有 3000 家 AI 創(chuàng)業(yè)公司,其中一半以上都是在英偉達的平臺上構(gòu)建的??萍季揞^也不例外,谷歌、微軟、臉書、亞馬遜都在購買英偉達芯片,用于構(gòu)建自己的數(shù)據(jù)中心。數(shù)據(jù)研究公司 Gartner 顯示,英偉達擁有 AI 芯片市場約四分之三的份額。上一財年,英偉達從用于數(shù)據(jù)中心的 AI 芯片銷售中獲得將近 30 億美元收入。在人工智能芯片領(lǐng)域,英偉達已經(jīng)是當(dāng)之無愧的江湖霸主。
挑戰(zhàn)者昇騰 910
AI 芯片這個江湖兇險異常,英偉達目前是霸主,可誰也不敢保證未來會發(fā)生什么。深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分,所謂訓(xùn)練,就是給不斷計算大數(shù)據(jù),讓它慢慢學(xué)會識別和區(qū)分對象;所謂推理,就是讓訓(xùn)練好的機器干活。GPU 芯片在算法訓(xùn)練上非常高效,可在推斷中對于單項輸入進行處理的時候,并行計算的優(yōu)勢不能完全發(fā)揮出來。
因為 GPU 芯片 在人工智能深度學(xué)習(xí)上的天生劣勢,一些企業(yè)將目光投向?qū)S锰幚硇酒?,采?FPGA/ASIC 技術(shù)路線設(shè)計專業(yè) AI 芯片。FPGA 的前期啟動成本低,后期可以進行再編程,可以采用 OpenCL等更高效的編程語言,降低硬件編程的難度,還可以整合系統(tǒng)模塊,提高應(yīng)用的靈活性,與GPU相比,F(xiàn)PGA 具備更強的平均計算能力和更低的功耗。
ASIC 運行速度比 FPGA 更快,是一種為專用目的設(shè)計的,面向特定用戶需求的定制芯片。在大規(guī)模量產(chǎn)的情況下具備性能更強、體積更小、功耗更低、成本更低、可靠性更髙等優(yōu)點。華為昇騰 910 就是 ASIC 芯片,它采用 7nm+ EUV 制程工藝,達芬奇架構(gòu),計算力可達到 256TFOPS,比英偉達最新的 V100 還要高出一倍。值得注意的是,昇騰 910 達到規(guī)格算力所需功耗僅 310W,明顯低于設(shè)計規(guī)格的 350W。
江山代有人才出,各領(lǐng)風(fēng)騷數(shù)百年,而在日新月異的科技領(lǐng)域,數(shù)百年的跨度會縮減為三五年。強如英偉達,在稱雄 AI 芯片領(lǐng)域六七年之后,也開始顯露頹勢。人工智能領(lǐng)域有三要素:數(shù)據(jù)、算法和算力。數(shù)據(jù)為芯片處理的對象,算法即計算的邊界,而算力則直接決定了計算效率。對于華為來說,芯片是它們的硬實力,算力即它在 AI 領(lǐng)域的競爭力。有了最強算力加持,昇騰 910 這個氣勢洶洶的挑戰(zhàn)者,擁有足夠的實力與底氣挑戰(zhàn)江湖霸主英偉達。
達芬奇 AI 架構(gòu)
昇騰 910 的誕生,使得華為在 AI 芯片領(lǐng)域地位大幅上升,不過這遠遠不夠。英偉達技術(shù)雄厚,有針對各種場景的優(yōu)化,華為僅靠一款芯片,打敗英偉達無從說起。在深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方面,英偉達現(xiàn)在擁有一個由軟件、大學(xué)、初創(chuàng)企業(yè)和合作伙伴組成的強大和自我維持的生態(tài)系統(tǒng),這些伙伴讓英偉達很難被擊敗。
同時,AI 芯片不是個特別大的行業(yè),AI 芯片在整個芯片領(lǐng)域占比不到 1%。華為進軍人工智能領(lǐng)域,追求的是全棧。所謂全棧,是指在芯片設(shè)計、訓(xùn)練推理計算框架 MindSpore 、全流程服務(wù)(ModelArts)一體到位。在全棧理念基礎(chǔ)上 華為宣布“達芬奇”架構(gòu),提出 MindSpore 計算框架,一舉橫跨公有云、私有云端、邊緣等,實現(xiàn)全棧全場景 AI 解決。
達芬奇是歐洲文藝復(fù)興時期最完美的代表,他是科學(xué)家、發(fā)明家、建筑
工程師,也是畫家。華為使用達芬奇這個名字,透露出其 AI 戰(zhàn)略布局的光芒與野心。數(shù)據(jù)預(yù)測,到 2025 年全球智能終端數(shù)量將會達到 400 億臺,智能助理的普及率將達到 90%,企業(yè)數(shù)據(jù)的使用率將達到 86%。
人工智能將會改變所有行業(yè),華為的理想是將 AI 技術(shù)融于產(chǎn)品,在達芬奇 AI 架構(gòu)基礎(chǔ)上構(gòu)建一個萬物智能的世界。昇騰 910 AI 芯片是達芬奇架構(gòu)的排頭兵,在不久的將來,華為勢必會研發(fā)更多的 ASIC 專用 AI 芯片,挑戰(zhàn)英偉達的 AI 生態(tài)系統(tǒng)!