芯片,目前在我國是一個(gè)高熱度話題。尤其是在貿(mào)易戰(zhàn)之后,每天有大量的報(bào)道充斥在我們周圍:一邊是我國芯片陷入“缺芯少魂”的絕境,一邊又是我國AI芯片“趕超歐美”的欣喜。這些在對(duì)立面的報(bào)道大大增加了人們的疑惑,到底誰說的對(duì),我國芯片行業(yè)目前真實(shí)的狀態(tài)究竟是怎樣?
其實(shí),這兩種看似對(duì)立的聲音都是正確的,都是我國芯片行業(yè)目前真實(shí)的現(xiàn)狀。只是有些人混淆了傳統(tǒng)芯片與AI芯片的概念。
傳統(tǒng)芯片,指的是中央處理器(CPU),它是一塊超大規(guī)模的集成電路,是一臺(tái)計(jì)算機(jī)的運(yùn)算核心(Core)和控制核心(Control Unit)。它的功能主要是解釋計(jì)算機(jī)指令以及處理計(jì)算機(jī)軟件中的數(shù)據(jù)。
在傳統(tǒng)芯片領(lǐng)域,美國一家獨(dú)大,占全球市場份額的60%以上。美國的英特爾、AMD、高通、博通、英偉達(dá)等都是全球頂尖的芯片制造商。在這一方面,中國的確落后于美國,并且在短時(shí)間內(nèi)極難追趕。“缺芯少魂”的說法也由此而來。
但在AI芯片領(lǐng)域,卻呈現(xiàn)出一副截然不同的畫面。
AI芯片并非廣義的芯片
AI芯片并不是真正意義上的芯片,從某種意義上來說,能實(shí)現(xiàn)AI加速功能的半導(dǎo)體器件都可以被稱為“AI芯片”。它可以被封裝成芯片的形態(tài),也可以被制成板卡的形態(tài),所以AI芯片也被稱為AI加速器或計(jì)算卡,是專門用于處理人工智能應(yīng)用中的大量計(jì)算任務(wù)的模塊(其他非計(jì)算任務(wù)仍由CPU負(fù)責(zé))。
圖:CPU的內(nèi)部結(jié)構(gòu)及工作原理 來源:百度百科
如圖所示,以往CPU負(fù)責(zé)整個(gè)系統(tǒng)的基本計(jì)算和運(yùn)行。但當(dāng)整個(gè)系統(tǒng)都需要使用人工智能這項(xiàng)功能時(shí),就需要消耗大量的算力。如果這時(shí)候仍由CPU的運(yùn)算單元來提供算力,可能就會(huì)出現(xiàn)因?yàn)樗懔Σ蛔愣八罊C(jī)”的情況。
AI芯片就是為了完成這些額外計(jì)算任務(wù)而誕生的。
目前,根據(jù)芯片的架構(gòu),以及通用性和計(jì)算性能的差異,我們通常把AI芯片分為: GPU 、ASIC、FPGA、類腦芯片四大類。
GPU采用的是單指令、多數(shù)據(jù)處理結(jié)構(gòu),主要處理圖像領(lǐng)域運(yùn)算加速的任務(wù)。但GPU無法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作。CPU可單獨(dú)作用,處理復(fù)雜的邏輯運(yùn)算和不同的數(shù)據(jù)類型,但當(dāng)需要大量地處理類型統(tǒng)一的數(shù)據(jù)時(shí),則可調(diào)用GPU進(jìn)行并行計(jì)算。
ASIC芯片是供專門應(yīng)用的集成電路芯片技術(shù),在集成電路界被認(rèn)為是一種為專門目的而設(shè)計(jì)的專用AI芯片。除了不能擴(kuò)展以外,在功耗、可靠性、體積等方面都有優(yōu)勢(shì),尤其在高性能、低功耗的移動(dòng)端。
FPGA,即現(xiàn)場可編程門陣列。它是專用集成電路(ASIC)領(lǐng)域中的一種半定制電路,既解決了定制電路不足的問題,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn),適用于多指令,單數(shù)據(jù)流的分析,常用于預(yù)測(cè)階段,如云端。FPGA是用硬件實(shí)現(xiàn)軟件算法,因此在實(shí)現(xiàn)復(fù)雜算法方面有一定的難度,缺點(diǎn)是價(jià)格比較高。
由于人腦結(jié)構(gòu)精密且復(fù)雜,芯片想要模仿人腦的工作模式并不容易,所以目前類腦芯片只有個(gè)別傳統(tǒng)芯片巨頭在從事相關(guān)研發(fā)工作。
國產(chǎn)崛起,拉開戰(zhàn)爭序幕
縱觀全球AI芯片格局,老牌芯片公司依然占據(jù)主導(dǎo)地位,但中國企業(yè)正在迅猛向前。
2018年,市場研究和咨詢公司Compass Intelligence發(fā)布了年度全球AI芯片公司排名報(bào)告。根據(jù)報(bào)告顯示,英偉達(dá)排名第一,英特爾、IBM、Google、蘋果、AMD、ARM、高通、三星、恩智浦等公司位列2-10名。在Top24的榜單排行中,已有六家中國公司入圍。分別是:第12位華為(海思)、第14位聯(lián)發(fā)科(MediaTek)、第20位瑞芯微(Rockchip)排名第20位、第21位芯原(Verisilcon)、第23位寒武紀(jì)(Cambricon)排名第23位、第24位地平線(Horizon)。
由于CUDA開發(fā)平臺(tái)的普及和較早研發(fā)GPU,英偉達(dá)的GPU是目前應(yīng)用最廣的通用AI硬件計(jì)算平臺(tái),它也牢牢地占據(jù)了榜單的第一名。
除了英偉達(dá),其他老牌的芯片巨頭也沒“閑”著,特別是英特爾。通過收購Altera,英特爾獲得了基于FPGA的AI方案,這讓英特爾得以躋身行業(yè)第一梯隊(duì)。
雖然中國企業(yè)暫時(shí)排名較后,但崛起的可能性無限。
如果從使用場景來看,AI芯片主要可分為兩類:一個(gè)是在數(shù)據(jù)中心部署的云端,一個(gè)是在消費(fèi)者端部署的終端。其中,云端主要以訓(xùn)練(Training)任務(wù)為主,終端以推理(Inference)任務(wù)為主。
訓(xùn)練任務(wù)即用大量標(biāo)記過的數(shù)據(jù)來“訓(xùn)練”相應(yīng)的系統(tǒng),使之可以適應(yīng)特定的功能。例如給系統(tǒng)海量的“人臉”的圖片,系統(tǒng)會(huì)通過訓(xùn)練記住每張“人臉”的特點(diǎn)、細(xì)節(jié)、差異。
推理任務(wù)即用訓(xùn)練好的系統(tǒng)來完成任務(wù)。接上面的例子,就是你將一張圖給之前訓(xùn)練過的系統(tǒng),之后系統(tǒng)就會(huì)自動(dòng)分辨出特定的“人臉”。
訓(xùn)練和推理在目前大多數(shù)的AI系統(tǒng)中,是相對(duì)獨(dú)立的過程,兩者對(duì)計(jì)算能力的要求也不盡相同。
完成訓(xùn)練任務(wù),需要極高的計(jì)算性能,需要較高的精度,需要能處理海量的數(shù)據(jù),需要有一定的通用性,以便完成各種各樣的學(xué)習(xí)任務(wù)。所以擁有大量原始數(shù)據(jù)的中國芯片廠家,將會(huì)在此脫穎而出。
相對(duì)來說,推理任務(wù)對(duì)性能的要求并不高,對(duì)精度要求也要更低,在特定的場景下,對(duì)通用性要求也低,能完成特定任務(wù)即可。但因?yàn)橥评淼慕Y(jié)果直接提供給終端用戶,所以用戶體驗(yàn)方面的優(yōu)化更為重要。這也給了大量注重用戶體驗(yàn)的中國企業(yè)新的超越機(jī)會(huì)。
在今年8月的人工智能大會(huì)上,華為的麒麟810、麒麟910、昇騰310、昇騰910;地平線“征程/旭日”系列、依圖的“求索”;阿里旗下玄鐵910、銳虎賁T710等AI芯片紛紛嶄露頭角。此外Thinkforce、翱捷和芯馳等后起之秀也在摩拳擦掌。
AI芯片的戰(zhàn)爭才剛剛開始。
作者:張偉超