新型基礎設施的完善,推動了人工智能技術在消費領域以及工業(yè)生產(chǎn)領域的應用,落地場景趨向細分化、垂直化。當人工智能進一步發(fā)展,深度學習模型的復雜度不斷增加,硬件和內(nèi)存逼近臨界點,CPU 這樣的通用芯片無法滿足人工智能任務要求時,AI 芯片應運而生。與此同時,隨著智能物聯(lián)時代掀開序幕,越來越多的數(shù)據(jù)開始在云、邊、端流動。急劇增長的數(shù)據(jù)量對 AI 芯片的算力和功耗提出了更高要求。
AI 芯片是專門用于處理人工智能應用中大量計算任務的模塊,主要分為 GPU、FPGA、ASIC。其中 GPU 主要處理圖像領域的運算加速,是最先被引入深度學習的類型,技術相對成熟;FPGA 是一種可以重構電路的芯片,用戶可以根據(jù)需求進行重復編程,適用于多指令和數(shù)據(jù)流的分析,性能出眾但技術壁壘較高;ASIC 即專用集成電路,除了不能擴展外,在功耗、可靠性方面均有優(yōu)勢,可定制、低成本是其顯著特點。
2021 年,全球“缺芯”潮依然未曾平復。中美兩國的貿(mào)易戰(zhàn)中,芯片是角力中的重頭戲。當中國致力于在 2030 年成為人工智能產(chǎn)業(yè)的全球領導者時,美國自然也不會甘心于自己在技術上的頭把交椅被撼動。而在 AI 芯片戰(zhàn)場,國內(nèi)外呈現(xiàn)出了完全不同的光景。
在“缺芯少魂”的危機意識倒逼下,中國加大自主研發(fā)力度尋求破局。BAT 互聯(lián)網(wǎng)大廠自研 AI 芯片均已揭曉。
百度發(fā)布了自主研發(fā)的第二代昆侖 AI 芯片“昆侖芯 2”,并宣布實現(xiàn)量產(chǎn)。2 代采用 7nm 制程,通用性顯著增強,可應用于互聯(lián)網(wǎng)、智慧城市、智慧工業(yè)等領域;
阿里平頭哥自研 AI 芯片含光 800 在雙十一期間成為了搜索推薦等場景算力的主力,支持了淘寶搜索、推薦等業(yè)務,其中淘寶主搜 100% 的 AI 算力由該芯片提供;
騰訊在其數(shù)字生態(tài)大會上也公布了自研芯片的進展,AI 推理芯片紫霄性能目前已經(jīng)流片成功并順利點亮。
在投融資領域,國內(nèi) AI 芯片賽道也頗為熱鬧。超 40 家 AI 芯片企業(yè)在 2021 年拿下新融資。地平線、黑芝麻智能、燧原科技、壁仞科技、昆侖芯、摩爾線程等企業(yè)的估值均超 100 億人民幣。
相較于國內(nèi)的百花齊放,國外 AI 芯片的格局要清晰得多。英偉達和英特爾依然占據(jù)了人工智能算力領域的主導位置,而率先闖進獨角獸陣營的歐美 AI 芯片企業(yè)僅有 6 家,分別是獲得谷歌首個 AI 芯片投資的 SambaNova Systems,將“史上最大”晶圓級芯片賣給阿聯(lián)酋云計算公司的 Cerebras Systems,來自英國的 Graphcore,創(chuàng)始團隊曾是谷歌 TPU 核心研發(fā)成員的 Groq,業(yè)界大神吉姆·凱勒的新東家 Tenstorrent 和主攻邊緣 AI 芯片的以色列初創(chuàng)公司 Hailo。
總體來說,受益于存量需求替代以及增量需求釋放,芯片行業(yè)將迎來新一輪增長契機。但目前產(chǎn)能不足仍是困擾全球芯片行業(yè)的主要問題。在芯片應用領域,中國是目前全球最大的芯片應用市場,但芯片自給率依然是一大挑戰(zhàn)。放眼整個芯片市場,中國仍處于追趕階段,還未掌握話語權。盡管現(xiàn)在國內(nèi)的芯片廠商不少,但在制程工藝上與國際領先水準差距依然很大,此外芯片制造短板也不容忽視。
但“危機”二字本就蘊藏著“轉危為機”的可能。國務院印發(fā)的《新時期促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》表明,發(fā)展集成電路產(chǎn)業(yè)已經(jīng)上升到國家戰(zhàn)略高度。未來相信會有更多的資本和企業(yè)加入到芯片設計制造行列。
回顧 2021 年,值得關注的是,在 AI 芯片步入發(fā)展快車道的同時,基于下游應用的強驅動,AI 芯片的技術創(chuàng)新進程得到推進。其中最引人矚目的是,曾經(jīng)長期止步于理論階段的“存算一體架構”芯片取得了較好的進展,少數(shù)企業(yè)已經(jīng)有成品問世。目前來看,存算一體 AI 芯片將成為未來主流的發(fā)展方向。
為什么要發(fā)展存算一體芯片
在傳統(tǒng)馮·諾伊曼架構下,計算和存儲分離,兩者間通過數(shù)據(jù)總線進行數(shù)據(jù)傳輸。計算單元從內(nèi)存中讀取數(shù)據(jù),計算完成后存回內(nèi)存。但隨著 AI 芯片的發(fā)展,這種架構也成為制約計算系統(tǒng)性能提升的主要瓶頸之一。一方面,存儲和計算之間性能不匹配的問題長期存在,存儲器的數(shù)據(jù)訪問速度跟不上計算單元的數(shù)據(jù)處理速度,存儲器帶寬在很大程度上限制了處理器的性能發(fā)揮,“存儲墻”日益嚴重,算力提升受限;另一方面,AI 計算往往要面臨海量數(shù)據(jù),數(shù)據(jù)總線的有限帶寬嚴重制約處理器的性能與效率,而且大量數(shù)據(jù)傳輸導致功耗居高不下,“功耗墻”挑戰(zhàn)日盛。
由于兩只攔路虎——“存儲墻”和“功耗墻”的存在,馮·諾依曼計算架構的局限性日益凸顯,因此亟需新型的計算架構應對未來應用場景的挑戰(zhàn)。在這一背景下,存算一體的概念重新進入業(yè)界視野。
“存算一體”并非新事物,其概念的提出最早可追溯到 20 世紀 60 年代,但受限于制作成本、制作工藝及需求驅動等問題,并未掀起多大波瀾。直到近年來人工智能的發(fā)展逐漸邁向正軌,存算一體才有機會嶄露頭角。
由于在存儲單元內(nèi)完成運算,這就直接解決 困擾業(yè)界許久的“存儲墻”問題,減少了數(shù)據(jù)搬運過程中高達 90% 的功耗消費。同時,這種架構也減少了等待數(shù)據(jù)讀取時算力的浪費,實際性能更好。這種優(yōu)勢被認為是解決 AI 特定場景需求的關鍵。
國內(nèi)外在存算一體方面都還處于起步階段,因此無論是行業(yè)龍頭還是初創(chuàng)公司都在積極蓄力,希望在這一賽道保持領先或實現(xiàn)彎道超車。
國外巨頭中,三星的動向值得持續(xù)關注。2021 年 2 月,三星發(fā)布了 HBM-PIM 存內(nèi)計算技術,在高帶寬內(nèi)存 (HBM) 配置中集成內(nèi)存處理 (PIM) 。這也是業(yè)界第一個 HBM 集成 AI 處理能力的芯片。據(jù)官方資料顯示,與現(xiàn)有的內(nèi)存解決方案相比,三星的 PIM 理論上可以通過可編程計算單元 (PCU) 提高 4 倍的性能。
另外,美國 AI 芯片初創(chuàng)公司 Myhtic 也是該領域的重要參與者。在 2021 年 C 輪融資中,Mythic 籌集 7000 萬美元,自成立以來 Mythic 的總融資額已達到 1.652 億美元。2020 年年底,Mythic 推出了其第一代 AI 芯片 M1108 AMP。與很多 AI 芯片不同,M1108 基于更加成熟的模擬計算技術,將足夠的存儲與大量并行計算單元打包在芯片上,以最大化內(nèi)存帶寬并減少數(shù)據(jù)移動的能力。
而在國內(nèi)企業(yè)中,看準這一趨勢的阿里巴巴落子可謂相當果斷。2021 年 12 月,達摩院宣布成功研發(fā)新型存算一體架構芯片,該芯片是全球首款基于 DRAM 的 3D 鍵合堆疊存算一體 AI 芯片。
除了阿里外,眾多初創(chuàng)公司也開始在這個賽道發(fā)力,知存科技、后摩智能、九天睿芯等皆是個中翹楚。
成立于 2017 年的知存科技推出了國際首個存算一體加速器 WTM1001 和首個存算一體 SoC 芯片 WTM2101。截止 2021 年,知存科技已完成累計近 3 億元的 A 輪系列融資。
后摩智能作為國內(nèi)首家采用存算一體技術打造大算力芯片的公司,其愿景也十分清晰:打造出具有“十倍效應”的 AI 芯片, 致力于滿足真正人工智能時代的超大算力需求。
九天睿芯成立于 2018 年,專注于神經(jīng)擬態(tài)感存算一體芯片研發(fā)。2021 年,九天睿芯已設計出基于 SRAM 的感存算一體架構芯片 ADA20X,可廣泛應用于多種視覺場景。
當前,存算一體芯片聚焦于低延遲、低功耗、高算力需求的邊緣計算,主要應用于音頻類、健康類及低功耗視覺端側應用場景中。隨著 AI 應用日益豐富,在推進規(guī)模化應用階段,終端廠商必然會關注成本問題,而成本和功耗有著直接的關系,低功耗的 AI 芯片往往意味著它能夠實現(xiàn)整機低成本。這對于存算一體芯片來說無疑是一片藍海。
任何一項技術都不是“萬金油”,存算一體亦然,它只針對某一類計算特別是以數(shù)據(jù)為主的 AI 計算,并不適合 CPU 等以控制為主的計算。而且這種架構正處于學術界向工業(yè)界遷移的關鍵時期,要真正實現(xiàn)轉化成功,一方面要求對存算一體技術有深刻的洞察,另一方面也要對 AI 應用落地有透徹的理解,兩者相結合才可能發(fā)生質(zhì)變,取得實質(zhì)性突破。
此外,存算一體作為新的芯片方向,還面臨電路設計、架構、軟件等諸多層面的挑戰(zhàn)。由于存算一體芯片和常規(guī)的芯片設計方案不同,目前市面上也沒有成熟的專用 EDA 工具輔助設計和仿真驗證;芯片流片之后,沒有成熟的工具協(xié)助測試;在芯片落地應用階段,也缺乏專用的軟件與之適配。如何完善重要技術的生態(tài)鏈,是行業(yè)上下游廠商應該共同考慮的問題。
“時勢造英雄?!泵恳淮斡嬎銟嫾艿拇笞兏锒紩?chuàng)造一個新的王者。從主機時代的 IBM、PC 時代的英特爾、移動時代的高通,現(xiàn)在進入智能物聯(lián)網(wǎng)的時代,問芯片天下,誰主沉浮?我們拭目以待。