《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動(dòng)態(tài) > 2020年汽車芯片行業(yè)深度報(bào)告

2020年汽車芯片行業(yè)深度報(bào)告

2020-10-09
來源: 智森匯
關(guān)鍵詞: 智能網(wǎng)聯(lián)汽車 EE

  1、芯片是軟件定義汽車生態(tài)發(fā)展的基石

  在智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)大變革背景下,軟件定義汽車?yán)砟钜殉蔀楣沧R。傳統(tǒng)汽車采用 的分布式 E/E 架構(gòu)因計(jì)算能力不足、通訊帶寬不足、不便于軟件升級等瓶頸,不能滿足 現(xiàn)階段汽車發(fā)展的需求,E/E 架構(gòu)升級已成為智能網(wǎng)聯(lián)汽車發(fā)展的關(guān)鍵。

  汽車 E/E 架構(gòu)升級主要體現(xiàn)在:1)硬件架構(gòu)升級。由分布式 ECU 向域控制/中央 集中架構(gòu)方向發(fā)展。好處在于:提升算力利用率,減少算力設(shè)計(jì)總需求;數(shù)據(jù)統(tǒng)一交互, 實(shí)現(xiàn)整車功能協(xié)同;縮短線束,降低故障率,減輕質(zhì)量。2)軟件架構(gòu)升級。通過 AutoSAR 等軟件架構(gòu)提供標(biāo)準(zhǔn)的接口定義,模塊化設(shè)計(jì),促使軟硬件解耦分層,實(shí)現(xiàn)軟硬件設(shè)計(jì) 分離;Classic AutoSAR 架構(gòu)逐步向 Classic AutoSAR 和 Adaptive AutoSAR 混合式架構(gòu)方 向發(fā)展。好處在于:可實(shí)現(xiàn)軟件/固件 OTA 升級、軟件架構(gòu)的軟實(shí)時(shí)、操作系統(tǒng)可移植;采集數(shù)據(jù)信息多功能應(yīng)用,有效減少硬件需求量,真正實(shí)現(xiàn)軟件定義汽車。3)通信架構(gòu) 升級。車載網(wǎng)絡(luò)骨干由 LIN/CAN 總線向以太網(wǎng)方向發(fā)展。好處在于:滿足高速傳輸、 高通量、低延遲等性能需求,同時(shí)也可減少安裝、測試成本。

  從博世對 E/E 架構(gòu)定義來看,硬件架構(gòu)的升級路徑表現(xiàn)為分布式(模塊化→集成 化)、域集中(域控制集中→跨域融合)、中央集中式(車載電腦→車-云計(jì)算)。即為分 布式 ECU(每個(gè)功能對應(yīng)一個(gè) ECU)逐漸模塊化、集成向域控制器(一般按照動(dòng)力域、 底盤域、車身域、信息娛樂域和 ADAS 域等),然后部分域開始跨域融合發(fā)展(如底盤 和動(dòng)力域功能安全、信息安全相似),并發(fā)展整合為中央計(jì)算平臺(即一個(gè)電腦),最后 向云計(jì)算和車端計(jì)算(中央計(jì)算平臺)發(fā)展。其中車端計(jì)算主要用于車內(nèi)部的實(shí)時(shí)處理, 而云計(jì)算作為車端計(jì)算的補(bǔ)充,為智能汽車提供非實(shí)時(shí)性(如座艙部分場景可允許微秒 級別的延遲)的數(shù)據(jù)交互和運(yùn)算處理。

  硬件架構(gòu)升級驅(qū)動(dòng)芯片算力需求呈現(xiàn)指數(shù)級提升趨勢。傳統(tǒng)汽車功能簡單,與外界 交互較少,常為分布式 ECU,主要為控制指令運(yùn)算(約為百萬條指令每秒)、無 AI 運(yùn)算 能力、存儲(chǔ)較小;智能網(wǎng)聯(lián)汽車,不僅需要與人交互,也需要大量與外界環(huán)境甚至云數(shù) 據(jù)中心交互,未來將面臨海量的非結(jié)構(gòu)化數(shù)據(jù)需要處理,車端中央計(jì)算平臺將需要 500+ 百萬條指令/秒的控制指令運(yùn)算能力、300+TOPS(即為 300*1012 次每秒)的 AI 算力。

  智能網(wǎng)聯(lián)汽車四大核心技術(shù):芯片、操作系統(tǒng)、算法、數(shù)據(jù)共同形成生態(tài)閉環(huán),芯 片是智能網(wǎng)聯(lián)汽車生態(tài)發(fā)展的基石。類比手機(jī)產(chǎn)業(yè)鏈,我們認(rèn)為芯片/操作系統(tǒng)或成為寡 頭壟斷格局,而從當(dāng)下行業(yè)發(fā)展看,芯片或格局相對較為穩(wěn)定,且處在產(chǎn)業(yè)核心位置。

  2. 汽車處理芯片由 MCU 向 AI 芯片方向發(fā)展

  半導(dǎo)體可分為模擬芯片、數(shù)字芯片、OSD 三大類。模擬電路是指處理模擬信號的電 子電路。模擬信號具有連續(xù)性,信號傳播的信息包含在幅度、頻率、相位的變化上,常 應(yīng)用于放大信號,信號源兩方面。數(shù)字電路是指處理數(shù)字信號的電子電路。數(shù)字信號以 二進(jìn)制邏輯代數(shù)為基礎(chǔ),實(shí)現(xiàn)簡單,系統(tǒng)可靠,具有算數(shù)運(yùn)算和邏輯運(yùn)算的功能。OSD 包括光電器件、傳感器、分立器件三個(gè)細(xì)分類型。

  2.1. 汽車數(shù)據(jù)處理芯片運(yùn)算由控制指令向 AI 運(yùn)算方向發(fā)展

  現(xiàn)階段,汽車芯片市場上對汽車數(shù)據(jù)處理芯片分類有按三類:1)智能運(yùn)算為主的 AI 芯片;2)算力較強(qiáng)的主 CPU;3)算力較弱的 MCU(仍可視為 CPU)。也有按兩類:1)智能運(yùn)算為主的 AI 芯片;2)CPU 運(yùn)算為主的 MCU。為了便于理解,主 CPU 和 MCU 的主要玩家都是同一類,而且 CPU 與 MCU 本質(zhì)均為控制指令運(yùn)算,因此我們采用第二 種分類方法。

  汽車芯片由以控制指令運(yùn)算為主的 MCU 向智能運(yùn)算為主的 AI 芯片方向發(fā)展。1) 控制指令運(yùn)算可執(zhí)行如等待指令、停機(jī)指令、空操作指令、中斷指令等,其運(yùn)算單位為 DMIPS:即 Dhrystone MIPS 測試下,計(jì)算能力為百萬條指令/秒,一般通用芯片常用其 表示,如傳統(tǒng)汽車電子的 MCU 等,代表廠商如英飛凌、瑞薩、恩智浦等。2)AI 矩陣 運(yùn)算常指對矩陣運(yùn)算做加速的能力,對應(yīng)用于圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)的運(yùn)算處理的 情況下,單位功耗將更低,計(jì)算速度更快,其運(yùn)算單位為 TOPS、Tflops,均指每秒運(yùn)算 1012 次。TOPS:指數(shù)據(jù)類型為整數(shù)型,常用于自動(dòng)駕駛等領(lǐng)域,代表產(chǎn)品如華為昇騰系 列芯片、地平線征程系列芯片、寒武紀(jì)的 MLU 系列芯片等。Tflops:指數(shù)據(jù)類型為單精度浮點(diǎn)數(shù),較整數(shù)型數(shù)據(jù)精度更高,通用 AI 芯片常用它表示,常用于如核實(shí)驗(yàn)室運(yùn)算、 分子動(dòng)力學(xué)運(yùn)算等,代表產(chǎn)品如英偉達(dá)的 GPU 芯片。

  在智能網(wǎng)聯(lián)汽車領(lǐng)域,Int8 數(shù)據(jù)類型精度即可滿足現(xiàn)階段 AI 運(yùn)算要求。Int 8 和 FP32 分為定點(diǎn)數(shù)和浮點(diǎn)數(shù),小數(shù)點(diǎn)的位置是固定的,則為定點(diǎn)數(shù),小數(shù)點(diǎn)的位置是浮動(dòng) 的,則為浮點(diǎn)數(shù)。Int8 代表 8 個(gè)字節(jié),此外,還有 int4,int16 等字節(jié)數(shù)越高,計(jì)算精度 會(huì)提升,但占用存儲(chǔ)增多,會(huì)降低計(jì)算速度,所以為保證滿足數(shù)據(jù)精度和運(yùn)算速度,常 用 Int8 數(shù)據(jù)類型,單位為 TOPS(即 1012次/秒)。

  汽車芯片結(jié)構(gòu)形式由 MCU 向 SOC 異構(gòu)芯片方向發(fā)展。汽車數(shù)據(jù)處理芯片按應(yīng)用 可分為 MCU(微控制器)、SoC(System on Chip 系統(tǒng)級芯片)。MCU 結(jié)構(gòu)簡單,可視 為簡化版本的 CPU,其將 CPU 的頻率和規(guī)格適當(dāng)縮減,并將內(nèi)存、計(jì)數(shù)器、IO 接口、 I/D 轉(zhuǎn)換等結(jié)構(gòu)都整合到單一芯片,形成芯片級的計(jì)算機(jī),主要用于汽車執(zhí)行端 ECU 中 進(jìn)行控制指令運(yùn)算。

  SoC 是一顆系統(tǒng)級芯片,常由 CPU+GPU+DSP+NPU+各種外設(shè)接 口、存儲(chǔ)類型等電子元件組成,現(xiàn)階段主要應(yīng)用于座艙 IVI、域控制等較復(fù)雜的領(lǐng)域。SOC 較 MCU 集成程度更高,常集成 AI 處理單元,功能更復(fù)雜。SOC 芯片:1) 硬件集成規(guī)模更為龐大,提升資源利用效率。常額外集成音頻處理 DSP/圖像處理 GPU/ 深度學(xué)習(xí)加速單元 NPU 等,單顆芯片上集成更多的配套電路,減小了面積,提升資源 利用率,片上互聯(lián)利于集成電路之間的高速互通互聯(lián)。2)芯片上軟件配套更大,提升處 理效率。SOC 芯片上有豐富的軟件配套(工具鏈、編譯器等),提升了處理效率。3)可 支持多任務(wù)的復(fù)雜系統(tǒng)。但并非所有的 SOC 芯片均為 AI 芯片,需集成一定規(guī)模的時(shí) 間網(wǎng)絡(luò)單元才是 AI 芯片,如華為昇騰芯片、地平線征程芯片、寒武紀(jì) MLU 芯片、特斯 拉 FSD 均為此類芯片。

  2.2. ARM 內(nèi)核提供芯片控制指令運(yùn)算能力

  CPU 架構(gòu)可分為 X86 為代表的復(fù)雜指令集架構(gòu),和 ARM 為代表的精簡指令集架 構(gòu)。汽車 CPU 架構(gòu)主要為 ARM 架構(gòu),在 MCU 和 SOC 中擔(dān)任控制指令運(yùn)算。CPU 架 構(gòu)可分為 CISC(復(fù)雜指令集)架構(gòu)和 RISC(精簡指令集)架構(gòu)。1)復(fù)雜指令集指令可 變格式,包括 8、16、32、64 位,其特點(diǎn)是單指令功能強(qiáng)大且復(fù)雜,指令執(zhí)行周期長, 可以直接操作內(nèi)存,常見的復(fù)雜指令集如 X86,代表企業(yè) intel、AMD。2)精簡指令集 的特點(diǎn)是單指令功能簡單、執(zhí)行速度快,編譯效率高,不能直接操作內(nèi)存,常見的精簡 指令集有 ARM、MIPS、OpenRISC 以及 RSIC-V 等,代表企業(yè):ARM。ARM 處理器內(nèi) 核廣泛用于嵌入式系統(tǒng),具有執(zhí)行效率高,低成本等優(yōu)點(diǎn)。

  ARM Cortex 系列主要分為 A、R、M 三類。1)Cortex-A 系列:常集成于 SOC 中, 面向性能密集型系統(tǒng)的應(yīng)用處理器內(nèi)核,帶寬多為 64/32 位,主頻可達(dá) GHz 級別 (1GHz=103MHz),當(dāng)主頻達(dá)到 1GHz 時(shí),其單核控制指令算力為幾千 DMIPS(DMIPS 即為百萬條指令每秒),多用于汽車座艙娛樂信息系統(tǒng)或 ADAS 領(lǐng)域;2)Cortex-M 系 列:常集成于 MCU 中,主要面向各類嵌入式應(yīng)用的微控制器內(nèi)核,主頻為幾十-幾百 MHz 級別,其單核控制指令算力為幾十至幾百 DMIPS,多用于汽車執(zhí)行端控制領(lǐng)域;3)Cortex-R 系列面向?qū)崟r(shí)應(yīng)用的高性能內(nèi)核,介于 A 與 M 之間。

  2.3. AI 處理器提供芯片智能運(yùn)算能力

  AI 處理器可分為云端處理器、邊緣端處理器、終端處理器。1)云端 AI 處理器, 支持 Int8 定點(diǎn)運(yùn)算或 FP16、FP32 浮點(diǎn)運(yùn)算,支持深度學(xué)習(xí)推理/訓(xùn)練要求,主要應(yīng)用 于政府、企業(yè)數(shù)據(jù)中心的服務(wù)器中,如服務(wù)金融業(yè)、航空航天、氣象預(yù)報(bào)、宇宙演化模 擬以及抗震分析等領(lǐng)域計(jì)算。此外在未來 5G 應(yīng)用,更多的汽車數(shù)據(jù)會(huì)傳送到車企數(shù)據(jù) 中心用來訓(xùn)練模型,實(shí)現(xiàn)軟件、算法的優(yōu)化。2)邊緣端 AI 處理器,Int8 定點(diǎn)運(yùn)算,支 持深度學(xué)習(xí)推理要求,主要應(yīng)用于工控機(jī)、安防攝像頭、機(jī)器人、汽車車端等領(lǐng)域,由 于所搭載設(shè)備的電力資源有限,能效比高(算力/功耗,值越高越經(jīng)濟(jì))、接口豐富等是 關(guān)鍵。3)終端 AI 處理器主要支持深度學(xué)習(xí)推理功能,主要應(yīng)用于手機(jī)等移動(dòng)終端,如 華為麒麟系列芯片。未來云邊端三類處理器并非競爭關(guān)系,而是未來會(huì)進(jìn)一步協(xié)同發(fā)展, 云端訓(xùn)練模型實(shí)現(xiàn)算法軟件的優(yōu)化,并提供給邊緣/終端進(jìn)行本地化 AI 運(yùn)算。

  車端 AI 處理器現(xiàn)階段主要負(fù)責(zé)深度學(xué)習(xí)的推理任務(wù)。智能算法范圍由大至小依次 為:人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)。應(yīng)用場景越少,對應(yīng)需要的實(shí)現(xiàn)的算 法越少,就越適用于專用芯片,可通過精簡處理器軟硬件模塊,使處理器計(jì)算效率、能 效比更高。

  2.4. 車規(guī)級芯片條件苛刻

  車規(guī)級芯片標(biāo)準(zhǔn)遠(yuǎn)高于消費(fèi)級,認(rèn)證流程長。1)工作環(huán)境更為惡劣:相比于消費(fèi) 芯片及一般工業(yè)芯片,汽車芯片的工作環(huán)境溫度范圍寬(-40 至 155 攝氏度)、高振動(dòng)、 多粉塵、多電磁干擾。2)可靠性安全性要求高:一般的汽車設(shè)計(jì)壽命都在 15 年或 20 萬 公里左右,遠(yuǎn)大于消費(fèi)電子產(chǎn)品壽命要求。在相同的可靠性要求下,系統(tǒng)組成的部件和 環(huán)節(jié)越多,對組成的部件的可靠性要求就越高。3)車規(guī)級芯片認(rèn)證流程長。一款芯片一 般需要 2 年左右時(shí)間完成車規(guī)級認(rèn)證,進(jìn)入車企供應(yīng)鏈后一般擁有 5-10 年的供貨周期。

  汽車標(biāo)準(zhǔn)需認(rèn)證可靠性標(biāo)準(zhǔn) AEC-Q 系列、質(zhì)量管理標(biāo)準(zhǔn) ISO/TS16949 其中之一, 此外需要通過功能安全標(biāo)準(zhǔn) ISO 26262 ASIL B(D)。ISO 26262 在 2011 年 11 月 15 日正 式發(fā)布,主要包括四個(gè)等級,分別為 ASIL A/B/C/D。ISO 26262 安全是汽車電子元件穩(wěn) 定性優(yōu)劣的評判依據(jù)之一,通過該等級代表其產(chǎn)品穩(wěn)定性合格,耐用,但不代表其算力、 能效比高。此外,還需要通過零失效的供應(yīng)鏈質(zhì)量管理標(biāo)準(zhǔn) TS16949/ISO 9000 國際認(rèn)證 體系下的汽車行業(yè)分支的標(biāo)準(zhǔn)認(rèn)證;另一個(gè)是 AEC-Q 認(rèn)證,由克萊斯勒、通用、福特制定的汽車電子元件安全性檢測標(biāo)準(zhǔn)。

  3. MCU 引領(lǐng)汽車由機(jī)械化時(shí)代走向電氣化時(shí)代

  3.1. MCU 承擔(dān)汽車執(zhí)行 ECU 的運(yùn)算大腦

  汽車發(fā)展初期,控制功能較少,一般新增一個(gè)功能便新增一個(gè) ECU(Electronic Control Unit,即電子控制單元),即為典型的分布式電子電氣架構(gòu)。因此,一般汽車中 包括多個(gè) ECU,每個(gè) ECU 管理不同的功能,而 MCU 芯片嵌入在 ECU 中作為運(yùn)算大 腦。MCU 的工作過程:傳感器輸入信號,輸入處理器對信號進(jìn)行模數(shù)轉(zhuǎn)換、放大等處 理后,傳遞給 MCU 進(jìn)行運(yùn)算處理,然后輸出處理器對信號進(jìn)行功率放大、數(shù)模轉(zhuǎn)換等, 使其驅(qū)動(dòng)如電池閥、電動(dòng)機(jī)、開關(guān)等被控元件工作。MCU 主要有 8 位、16 位、32 位, 位數(shù)越多越復(fù)雜,處理能力越強(qiáng),可實(shí)現(xiàn)的功能越多。

  MCU 單車價(jià)值量提升的核心邏輯在于:1)芯片用量提升,應(yīng)用領(lǐng)域由傳統(tǒng)底盤延伸至整車。隨著汽車電子化發(fā)展,ECU 逐漸占領(lǐng)整個(gè)汽車,從防抱死制動(dòng)系統(tǒng)、四輪驅(qū) 動(dòng)系統(tǒng)、電控自動(dòng)變速器、主動(dòng)懸架系統(tǒng),到現(xiàn)在逐漸延伸到了車身各類安全、網(wǎng)絡(luò)、 娛樂控制系統(tǒng)等領(lǐng)域。2)芯片集成復(fù)雜化,單價(jià)提升。以發(fā)動(dòng)機(jī)管理系統(tǒng) ECU(MCU 為其核心芯片)為例,汽車電子發(fā)展的初期,ECU 最早僅應(yīng)用于發(fā)動(dòng)機(jī)的控制,如汽車 發(fā)動(dòng)機(jī)的排氣管(氧傳感器)、氣缸(爆震傳感器)、水溫傳感器等核心部件才會(huì)放置傳 感器,數(shù)量少。之后隨著國三至國五標(biāo)準(zhǔn)的提升,在油耗控制、信號輸出控制等方面需 要芯片處理的能力增強(qiáng),推動(dòng) MCU 芯片集成度提升,產(chǎn)品升級帶來價(jià)值提升。

  3.2. 預(yù)計(jì) 2025 年我國汽車 MCU 市場達(dá) 32.9 億美元,CAGR 7.7%

  2025 年我國汽車 MCU 市場規(guī)模達(dá) 32.9 億美元,未來 6 年 CAGR 為 7.7%。經(jīng)測 算,2019 年我國汽車 MCU 市場規(guī)模為 21.1 億美元,同比-2.7%,隨著汽車智能化加速, 更多的功能將會(huì)被整車搭載,大量執(zhí)行元件需要被 MCU 所控制,到 2025 年 MCU 市場 規(guī)模達(dá) 32.9 億美元,CAGR 為 7.7%,到 2030 年將達(dá) 47.6 億美元。

  3.3. 汽車 MCU 行業(yè)加快整合集中度提升

  全球 MCU 通用市場并購加速。我們重點(diǎn)參考 MCU 通用領(lǐng)域(汽車、工業(yè)、消費(fèi) 電子等)市場,MCU 廠商為爭奪市場份額,近年來發(fā)生了數(shù)起大規(guī)模并購。NXP 在 2015 年以 118 億美元收購飛思卡爾,完成了在汽車電子領(lǐng)域的布局,排名也一舉從第六上升 至第一;Cypress 在 2015 年以 40 億美元收購 spansion;Microchip 在 2016 年完成對 Atmel 的收購,成為全球第二大 MCU 廠商。我們判斷,汽車 MCU 市場也將隨通用市場的加 快整合,實(shí)現(xiàn)集中度的提升。

  歐美日前五大汽車 MCU 供應(yīng)商占據(jù)全球 82.7%市場份額,頭部集中效應(yīng)顯著。根 據(jù) Stratety Analytics 分析數(shù)據(jù),全球汽車 MCU 市場前 5 占 82.7%的市場份額,前五大 MCU 供應(yīng)商分別為日本瑞薩電子,歐洲:NXP、英飛凌,美國:德州儀器、微芯科技。

  全球前八大廠商也同樣占據(jù)我國汽車 MCU 93%的市場份額。仍由歐美日傳統(tǒng)汽車電子廠商占據(jù)絕大部分市場份額,我們重點(diǎn)參考 IHS 數(shù)據(jù)分析,目前中國 MCU 市場, 前八大 MCU 廠商的市場占有率達(dá)到 93%。國產(chǎn)化率不足 5%,替代空間大。國內(nèi)企業(yè) 技術(shù)較為薄弱,企業(yè)規(guī)模與前八大廠商差距較大,現(xiàn)階段主要為工業(yè)控制、儀器儀表、 消費(fèi)電子、物聯(lián)網(wǎng)等通用領(lǐng)域供貨。隨著國內(nèi)企業(yè)技術(shù)逐漸成熟,國內(nèi)廠商憑借價(jià)格和 服務(wù)優(yōu)勢,正逐步搶奪低端 MCU 市場,進(jìn)口替代趨勢逐漸明顯。但由于車規(guī)級標(biāo)準(zhǔn)較 高,技術(shù)和市場發(fā)展均晚于一般工業(yè)和消費(fèi)級芯片。

  4. 軟件定義汽車時(shí)代來臨,域控制 AI 芯片是重要一環(huán)

  4.1. AI 芯片是智能汽車時(shí)代實(shí)現(xiàn)域控制的核心

  汽車由分布式架構(gòu)向域控制/中央集中式架構(gòu)方向發(fā)展。傳統(tǒng)分布式硬件架構(gòu)面臨 智能汽車時(shí)代多維感知需求和海量非結(jié)構(gòu)化數(shù)據(jù)處理的需求,一般每新增一個(gè)應(yīng)用功能, 便新增對應(yīng)的感知傳感器、決策、執(zhí)行層。隨著智能網(wǎng)聯(lián)汽車時(shí)代的到來,以特斯拉為 代表的汽車電子電氣架構(gòu)改革先鋒率先采用中央集中式架構(gòu),即用一個(gè)電腦控制整車。全球范圍內(nèi)各大主機(jī)廠均已認(rèn)識到軟件定義汽車的大趨勢,紛紛升級自身的電子電氣架 構(gòu),雖不同主機(jī)廠采用幾個(gè)電腦控制整車的方案不同,但架構(gòu)域控制/集中化方向相同。域控制器逐漸集成前期的傳感器處理器、數(shù)據(jù)融合、路徑規(guī)劃、決策等諸多運(yùn)算處理器 功能,因此對域控制器芯片算力需求大幅提升。

  非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)致傳統(tǒng) MCU 不能滿足需求,AI 作為協(xié)處理器逐漸成為智能時(shí)代 的核心。隨著芯片需要處理傳感器傳來的大量汽車內(nèi)外部環(huán)境信息,而且也要處理大量 圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù),面向控制指令運(yùn)算的 MCU 不能滿足需求。AI 處理器作為 智能時(shí)代的協(xié)處理器,成為智能汽車時(shí)代的核心。一般待處理數(shù)據(jù)信息會(huì)先傳遞給 CPU(等同于 MCU),CPU 發(fā)現(xiàn)有大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù),自身無法處理,便將其傳輸給 AI 處理器運(yùn)算,而 CPU 便暫停運(yùn)算,等待 AI 處理器運(yùn)算結(jié)束后,再進(jìn)行下一步操作, 所以 AI 處理器是人工智能時(shí)代的協(xié)處理器,是現(xiàn)階段智能汽車時(shí)代運(yùn)算的核心。

  4.2. 預(yù)計(jì) 2025 年我國汽車 AI 芯片市場超 91 億美元,CAGR46.2%

  假設(shè):1)汽車市場容量預(yù)測。如前文 MCU 測算假設(shè)一致,我國汽車產(chǎn)量 2019-2025 年復(fù)合增速為 2%。

  2)各級別自動(dòng)駕駛滲透率預(yù)測。L3、L4 級分別于 2020 年、2023 年規(guī)模量產(chǎn),每 年并以 3-4%滲透率提升。根據(jù)工信部發(fā)布的《汽車中長期發(fā)展規(guī)劃》指出,我國 2020 年自動(dòng)駕駛滲透率達(dá) 50%,2025 年滲透率達(dá) 80%。L3 級于 2020 年開始量產(chǎn)并規(guī)模投 放市場,滲透率快速提升,隨著 L4 級車于 2023 年開始量產(chǎn),低級別滲透率陸續(xù)到達(dá)滲 透率峰值后又緩慢下降。

  3)各級別自動(dòng)駕駛 AI 芯片單車價(jià)值預(yù)測。2020 年 L1-L3 級 AI 芯片單車價(jià)值分別 為 50 美元、150 美元、500 美元,隨著技術(shù)逐漸成熟,2030 年下降到 41 美元、111 美 元、315 美元。我們預(yù)計(jì)到 2023 年 L4 級高級自動(dòng)駕駛出現(xiàn),AI 芯片單車價(jià)值約為 1500 美元,到 2030 年下降到 931 美元。

  2025 年我國 AI 芯片市場超 91 億美元,未來 6 年復(fù)合增速達(dá) 46.4%。經(jīng)測算,2020 年我國汽車 AI 芯片市場規(guī)模為 15 億美元,同比增長 59.4%,隨著汽車 EE 架構(gòu)加速升 級,域控制器/中央計(jì)算平臺被廣泛使用,到 2025 年 AI 芯片市場規(guī)模達(dá) 91 億美元, CAGR 為 45.9%,到 2030 年將達(dá) 177 億美元,十年復(fù)合增速 28.1%。

  4.3. 集成更多 AI 單元是智能芯片技術(shù)路徑發(fā)展的大趨勢

  CPU,又稱中央處理器,擅長邏輯控制和通用類型數(shù)據(jù)運(yùn)算,具有不可替代性。CPU 有很強(qiáng)的通用性,可處理不同的數(shù)據(jù)類型,主要負(fù)責(zé)順序控制、操作控制、時(shí)間控制、 數(shù)據(jù)加工等操作,因此在任何一個(gè)電腦或嵌入式的計(jì)算中都有 CPU 或其裁剪版本。CPU 由控制器(Control),寄存器(Cache、DRAM)和邏輯單元(ALU)構(gòu)成,其中控制器 和寄存器占比較大,而處理數(shù)據(jù)的邏輯單元占比較小,因此對于專用領(lǐng)域數(shù)據(jù)處理能力 較弱。代表廠商即為 X86 處理器的英特爾和嵌入式處理器的 ARM。

  GPU,又稱圖形處理器,俗稱顯卡,擅長大規(guī)模并行計(jì)算。GPU 擁有計(jì)算單元數(shù)量 眾多和超長的流水線,處理的數(shù)據(jù)類型通常為高度統(tǒng)一的、相互無依賴,省去了大量 CPU 的不必要控制指令計(jì)算模塊,并行計(jì)算能力較 CPU 強(qiáng)。隨著人工智能的發(fā)展,GPU 不 斷被應(yīng)用于數(shù)值模擬、機(jī)器學(xué)習(xí)、視覺處理、語音識別等領(lǐng)域,廠商代表即為英偉達(dá)。

  FPGA 全稱是 Field Programmable Gate Array:又稱可編程邏輯門陣列,算力較 高,適合小規(guī)模定制化開發(fā)測試。用戶可通過燒入配置文件來定義其內(nèi)部結(jié)構(gòu)的連線, 從而達(dá)到定制電路的目的。FPGA 的芯片量產(chǎn)成本較高,能效比較差,不如 ASIC 專用 芯片。適用于科研、企業(yè)開發(fā)階段,一旦方案確定,其成本優(yōu)勢就不再突出。代表廠商:賽靈思、阿爾特拉(被英特爾收購)、深鑒科技。

  ASIC 全稱是 Application-Specific Integrated Circuit:是一種為專門目的而設(shè)計(jì)的 集成電路,具有算力最高,能效比優(yōu)等特點(diǎn)。ASIC 面向特定用戶的需求,適合較為單 一的大規(guī)模應(yīng)用場景,運(yùn)行速度在同等條件下比 FPGA 快。但在架構(gòu)層面對特定智能算再適用,需要跟新?lián)Q代。面對現(xiàn)階段,AI 算法日新月異,每年都有大量的算法被開發(fā)出 來,對于自動(dòng)駕駛領(lǐng)域適用性不強(qiáng)。所以現(xiàn)階段并沒有真正意義上的 ASIC 芯片。

  N-SOC,(即添加神經(jīng)網(wǎng)絡(luò)單元的系統(tǒng)級芯片)是指在芯片中集成更多的神經(jīng)網(wǎng)絡(luò) 單元,以實(shí)現(xiàn)快速的 CNN(卷積神經(jīng)網(wǎng)絡(luò))運(yùn)算。N-SOC 是現(xiàn)階段市場的新名詞,主 要系隨著 AI 芯片的發(fā)展,傳統(tǒng)定義方法并不完全適用,N-SOC 區(qū)別于 ASIC 的智能算 法被硬化,但其并不是一顆完全通用芯片,僅支持少量的算法。典型的代表企業(yè):英特 爾旗下的 Mobileye、華為(達(dá)芬奇架構(gòu) Ascend 系列)、寒武紀(jì)(MLU 系列)、百度(昆 侖云)、阿里平頭哥、Google(TPU)等。

  由通用向?qū)S门判蛞来危篊PU、GPU、FPGA、ASIC;數(shù)據(jù)處理成本經(jīng)濟(jì)性(由優(yōu) 至差):ASIC、FPGA、GPU、CPU。1)CPU 最通用,算力差,能效比最差,但除了運(yùn) 算,還包括控制指令,不可被替代;2)GPU 為較為通用的芯片,算力高,架構(gòu)較為開 放,可允許主機(jī)廠基于底層硬件架構(gòu)開發(fā)自己的專門算法,但能效比較差;3)FPGA, 算力一般,可根據(jù)客戶需求用配置文件更改芯片結(jié)構(gòu)的連線,實(shí)現(xiàn)定制電路,適用于實(shí) 驗(yàn)室科研、前期開發(fā)等小批量應(yīng)用;4)ASIC 為專用芯片,算力高、能效比優(yōu),節(jié)約不 必要開發(fā)資源,規(guī)模量產(chǎn)成本最低,但支持算法不夠靈活。

  AI 芯片通過添加神經(jīng)網(wǎng)絡(luò)單元實(shí)現(xiàn) AI 運(yùn)算的更高效。目前市場對未來汽車 AI 芯 片采用通用 GPU、FPGA、ASIC 芯片方案仍有較大爭議,我們認(rèn)為汽車數(shù)據(jù)處理芯片不 斷異構(gòu)化,通過不斷添加神經(jīng)網(wǎng)絡(luò)單元實(shí)現(xiàn) AI 運(yùn)算是未來發(fā)展的主要方向。除了華為、 地平線、寒武紀(jì)等 AI 芯片不斷增加神經(jīng)網(wǎng)絡(luò)單元外,而作為通用 GPU 的代表供應(yīng)商英 偉達(dá)的自動(dòng)駕駛系列芯片,也通過添加神經(jīng)網(wǎng)絡(luò)單元,以實(shí)現(xiàn)對 AI 處理越來越高效。但總體而言 GPU 仍功耗較高,豐富的通用模塊可實(shí)現(xiàn)對各種場景的適用性,但也帶來 了成本過高,功耗過高的問題。而新出現(xiàn)的 N-SOC 雖不是 ASIC 固定算法,具有成本/ 功耗較低等優(yōu)點(diǎn),但其針對各種場景的適應(yīng)性仍較弱。在汽車領(lǐng)域,未來兩者未來性能、 成本等方面會(huì)有相互靠近的趨勢。

  5. 域控制器 AI 芯片呈現(xiàn)三強(qiáng)多極競爭格局

  結(jié)論:特斯拉 FSD 芯片自研自用,引領(lǐng)產(chǎn)業(yè)發(fā)展,屬于獨(dú)立一級;全球 GPU 領(lǐng)域 AI 龍頭英偉達(dá)和背靠英特爾的汽車 AI 芯片龍頭 Mobileye 屬于第一陣列;華為技術(shù)強(qiáng) 勁自建生態(tài)體系屬于 1.5 陣列,有望快速突圍進(jìn)入第一陣列;國內(nèi)智能駕駛 AI 芯片新 銳地平線、云邊端全領(lǐng)域覆蓋 AI 新興寒武紀(jì)等處于第二陣列;傳統(tǒng)汽車電子廠商及其 他潛在進(jìn)入者處于第三陣列

  特斯拉自研 FSD 方案屬于另一極。主要優(yōu)勢:由于其自研自用,根據(jù)需求研發(fā)專 用芯片,減少不必要的軟硬件模塊,1)縮短研發(fā)周期,減少研發(fā)設(shè)計(jì)工作量;2)提升 能效比;3)用戶數(shù)據(jù)驅(qū)動(dòng)研發(fā)優(yōu)化。主要劣勢:1)生態(tài)較為封閉,僅內(nèi)部開發(fā)和使用, 無法建立完善的生態(tài)體系。2)若使用量有限,芯片研發(fā)需要投入大量資金,軟硬件開發(fā) 的成本難以通過大規(guī)模使用均攤成本。

  Mobileye 與英偉達(dá)屬于第 1 陣列。在 L3 級到來以前,兩公司產(chǎn)品幾乎不會(huì)處于正 面競爭,隨著自動(dòng)駕駛進(jìn)程加速發(fā)展,競爭會(huì)逐漸加劇。短期來看,Mobileye 面向 L3 級以下市場,產(chǎn)品更加成熟,會(huì)更占優(yōu)勢。中長期來看,英偉達(dá)面向 L3 級以上預(yù)研市 場在 AI 領(lǐng)域?qū)嵙ι詈?,后發(fā)有力,優(yōu)勢會(huì)更加突出。

  NIVIDA 屬于第 1 陣列,作為通用 AI 芯片龍頭,占據(jù) L3 級及以上市場,對外提 供芯片級產(chǎn)品,而非芯片+算法的解決方案,是合資品牌的優(yōu)選。主要優(yōu)勢:1)中立第 三方,最豐富的生態(tài)體系。定位 Tier 2 芯片供應(yīng)商,提供芯片或開發(fā)平臺,具備最完善的軟件工具鏈和應(yīng)用生態(tài);2)算力高(但利用率仍有待提升),Xaier 芯片的 30TOPS 高 于 Eye Q4 的 2.5TOPS,Orin 芯片的 200TOPS 高于 Eye Q5 的 24TOPS;3)支持各類傳 感器數(shù)據(jù)融合,可提供攝像頭+雷達(dá)等各類傳感器數(shù)據(jù)融合處理;4)提供云服務(wù),有望 獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化。主要劣勢:主要系 GPU 通用芯片,有大量的非必要軟硬件模塊, 1)成本價(jià)格較貴,浪費(fèi)資源,后續(xù)有望規(guī)模量產(chǎn)后實(shí)現(xiàn)快速下降;2)能效比差,后續(xù) 產(chǎn)品開發(fā)加入更多的 DLA 深度學(xué)習(xí)加速器模塊,能效比有望改善。

  Mobileye 屬于第 1 陣列,背靠英特爾,占據(jù) L2 級及以下市場,芯片+算法綁定的 一體式解決方案。主要優(yōu)勢:1)經(jīng)驗(yàn)豐富&質(zhì)量可靠,產(chǎn)品已經(jīng)有眾多量產(chǎn)車搭載,質(zhì) 量和適配過關(guān);2)客戶資源最豐富,國內(nèi)外絕大多數(shù)主機(jī)廠和 Tier1 級供應(yīng)商均為其客 戶;3)價(jià)格較為合理。主要劣勢:1)算力提升明顯低于其他廠商,最新 EyeQ5 算力峰 值僅 24TOPS,而市場認(rèn)為 L3 級算力需求 30TOPS 以上,后期芯片僅靠提升 VMP 等手 段,算力提升或難以為繼,又或者因?yàn)楦叨榷ㄖ苹槍σ曈X領(lǐng)域,減少不必要的軟硬件 資源,算力不高但性能仍滿足需求;2)黑盒子模式限制用戶創(chuàng)新,算法和芯片捆綁銷 售,或與廠商規(guī)模較小,為客戶提供定制化服務(wù),在主機(jī)廠軟件開發(fā)能力較差的初期階 段受廣泛歡迎,但隨著開發(fā)能力提升,一體銷售的靈活度較差,客戶難以做出差異性產(chǎn) 品。根據(jù)規(guī)劃 Eye Q5 或?qū)㈤_放融合算法,但感知算法并未提及。

  華為屬于第 1.5 陣列,憑借強(qiáng)勁的技術(shù)實(shí)力有望快速進(jìn)入第一陣列,主要針對 L2+ 及以上市場,模式與 NVIDIA 類似,現(xiàn)階段對外提供平臺類產(chǎn)品(開發(fā)平臺),而非解 決方案,是國產(chǎn)品牌的優(yōu)選。主要優(yōu)勢:1)算力高,能效優(yōu),計(jì)算平臺可提供 64~350TOPS, 端到端 1TOPS/W(芯片級 2TOPS/W);2)支持各種傳感器融合處理;3)華為整體技術(shù) 雄厚,生態(tài)體系有望迅速完善,依托華為從底層芯片、操作系統(tǒng)、應(yīng)用算法、5G、云計(jì) 算服務(wù)等迅速建立豐富生態(tài)體系;4)提供云服務(wù),有望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化。主要劣勢:1)無量產(chǎn)車,缺乏相關(guān)的經(jīng)驗(yàn)積累,暫時(shí)無數(shù)據(jù)優(yōu)化軟件算法,搭載量產(chǎn)車或到 2021 年底左右;2)現(xiàn)階段生態(tài)體系仍弱于英偉達(dá),所以目前華為廣交朋友圈,依靠眾多領(lǐng)域 的優(yōu)勢構(gòu)建龐大生態(tài)體系;3)客戶對其“不造車”尚持懷疑,或影響合作。

  地平線屬于強(qiáng)勢第 2 陣列,模式與 Mobileye 類似,對外主要提供解決方案類產(chǎn)品 (芯片+算法),未捆綁銷售,AI 芯片于 2020 年已搭載在長安 UNI-T 座艙域。自動(dòng)駕 駛域芯片尚未搭載量產(chǎn)車,現(xiàn)階段主要針對 L2 級及以下市場,對外提供芯片+算法方 案。主要優(yōu)勢:1)作為中立第三方,芯片和算法可分開銷售或一體式解決方案,受客戶 信任;2)國產(chǎn)芯片,國內(nèi)優(yōu)選。主要劣勢:1)現(xiàn)階段算力較低,無豐富生態(tài),創(chuàng)企等;2)尚未通過功能安全認(rèn)證,無自動(dòng)駕駛芯片量產(chǎn)車。

  寒武紀(jì)屬于第 2 陣列,或從車路協(xié)同、云服務(wù)(數(shù)據(jù)中心)等領(lǐng)域?qū)崿F(xiàn)快速切入。主要優(yōu)勢:1)云邊端三類產(chǎn)品可從各種商業(yè)模式供應(yīng)給智能車產(chǎn)業(yè)領(lǐng)域,云端產(chǎn)品可 供應(yīng)車企/Tier 1 數(shù)據(jù)中心或提供給云服務(wù)供應(yīng)商;邊緣端產(chǎn)品供應(yīng)給政府類客戶用于車 路協(xié)同設(shè)備使用;邊緣/終端產(chǎn)品供應(yīng)給主機(jī)廠等。2)國產(chǎn)芯片,國內(nèi)優(yōu)選、中立第三方。主要劣勢:1)與車企合作較少,無豐富生態(tài),創(chuàng)企等;2)尚未通過功能安全認(rèn)證。

  5.1. 特斯拉:自研 FSD 芯片,引領(lǐng)產(chǎn)業(yè)發(fā)展

  總結(jié):特斯拉自研 FSD 方案屬于另一極。主要優(yōu)勢:由于其自研自用,根據(jù)需求 研發(fā)專用芯片,減少不必要的軟硬件模塊。1)縮短研發(fā)周期,減少研發(fā)設(shè)計(jì)工作量;2) 提升能效比;3)用戶數(shù)據(jù)驅(qū)動(dòng)研發(fā)優(yōu)化。主要劣勢:1)生態(tài)較為封閉,僅內(nèi)部開發(fā)和 使用,無法建立完善的生態(tài)體系。2)若使用量有限,芯片研發(fā)需要投入大量資金,軟硬 件開發(fā)的成本難以通過小規(guī)模使用均攤成本。

  Autopilot 1.0 系統(tǒng)因 Mobileye EyeQ3 算力低、算法和芯片捆綁銷售限制創(chuàng)新被棄 用。2014 年特斯拉發(fā)布 Autopilot 1.0,視覺芯片采用 Mobileye EyeQ3,數(shù)據(jù)融合芯片采 用英偉達(dá) Tegra 3。搭載 1 個(gè)前置攝像頭、1 個(gè)后置倒車攝像頭(不參與輔助駕駛)、1 個(gè) 前置雷達(dá)、12 個(gè)超聲波傳感器。特斯拉棄用主要原因在于:EyeQ3 算力僅 0.256TOPS, 而且視覺感知算法和芯片捆綁銷售,影響產(chǎn)品創(chuàng)新。

  Autopilot 2.0 系統(tǒng)因 NVIDIA PX2 方案能效比差,成本較高被棄用。2.0 系統(tǒng)較上 一代提升 40 倍性能,系統(tǒng)由 1.0 系統(tǒng)的雷達(dá)引導(dǎo)為主,轉(zhuǎn)變?yōu)橐詳z像頭為主,雷達(dá)作為 輔助。硬件方案采用 NVIDIA 的 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構(gòu)芯片方案;支 持 8 個(gè)攝像頭、12 個(gè)超聲波雷達(dá)和 1 個(gè)前置毫米波雷達(dá)。2.5 系統(tǒng)仍是 NIVIDIA 方案的 延續(xù)。特斯拉棄用 NVIDIA 方案主要原因在于:NVIDIA PX2 方案 GPU 芯片仍有較多 的軟硬件資源浪費(fèi),能效比(算力/功耗)較差,成本較高。

  特斯拉 Autopilot 3.0 系統(tǒng)自研 FSD+算法。3.0 系統(tǒng)采用了自研的 FSD 芯片方案, 2 顆 FSD 芯片實(shí)現(xiàn)冗余設(shè)計(jì),共 2*72TOPS/72W,針對自身應(yīng)用算法和場景專門設(shè)計(jì) FSD,可減少不必要的軟硬件模塊,實(shí)現(xiàn)資源的最大化利用。Autopilot 3.0 實(shí)際應(yīng)用性能 相比 2.5 版本提升 21 倍,功耗僅高 25%,其成本卻只有 2.5 版本的 80%。兩顆芯片將運(yùn) 算結(jié)果互相比對,若結(jié)果正確則執(zhí)行操作,若錯(cuò)誤則返回重算,而且若某顆芯片出現(xiàn)故 障,自動(dòng)駕駛系統(tǒng)仍不受影響。

  FSD 芯片是一顆 CPU+GPU+ISP+2*NPU 的異構(gòu)芯片。芯片異構(gòu)化是總體發(fā)展方 向,讓專用處理單元運(yùn)算對應(yīng)的操作。1)CPU 是 1 個(gè) 12 核心 ARM A72 架構(gòu)的 64 位處 理器,運(yùn)行頻率為 2.2GHz;2)GPU 能夠提供 0.6TFLOPS 計(jì)算能力,運(yùn)行頻率為 1GHz;3)2 顆 NPU(神經(jīng)網(wǎng)絡(luò)單元)運(yùn)行在 2.2GHz 頻率下能提供 2*36TOPS 的處理能力。為 了提升神經(jīng)網(wǎng)絡(luò)處理器的內(nèi)存存取速度以提升計(jì)算能力,每顆 FSD 芯片內(nèi)部還集成了 32MB 高速緩存

  FSD 芯片針對自身需求專門開發(fā),是特斯拉芯片性能高和功耗優(yōu)的重大法寶。發(fā)布 Autopilot 3.0 時(shí),特斯拉宣稱 FSD 芯片算力為 72TOPS,系統(tǒng)整體算力 2*72TOPS,而 NVIDIA Xavier 芯片僅為 21TOPS。盡管之后 NVIDIA 公布 Xavier 理論計(jì)算能力為 30TOPS,但依然不及 FSD芯片。而NVIDIA DRIVE AGX Pegasus計(jì)算平臺,基于2*Xavier 和 2*TensorCore GPU,算力達(dá)到 320TOPS,功耗為 320W,高于 Autopilot 3.0 系統(tǒng)的 72W。主要系 FSD 芯片作為特斯拉專用芯片,較 GPU 的通用芯片可減少不必要的軟硬 件模塊,實(shí)現(xiàn)資源的最大化利用。

  5.2. NVIDIA:全球通用 AI 芯片龍頭,構(gòu)建生態(tài)王國(略)

  結(jié)論:NIVIDA 屬于第 1 陣列,作為通用 AI 芯片龍頭,占據(jù) L3 級及以上市場,對 外提供芯片級產(chǎn)品,而非芯片+算法的解決方案,是合資品牌的優(yōu)選。主要優(yōu)勢:1)中 立第三方,最豐富的生態(tài)體系。定位 Tier 2 芯片供應(yīng)商,提供芯片或開發(fā)平臺,具備最 完善的軟件工具鏈和應(yīng)用生態(tài);2)算力高(但利用率仍有待提升),Xaier 芯片的 30TOPS 高于 Eye Q4 的 2.5TOPS,Orin 芯片的 200TOPS 高于 Eye Q5 的 24TOPS;3)支持各類 傳感器數(shù)據(jù)融合,可提供攝像頭+雷達(dá)等各類傳感器數(shù)據(jù)融合處理;4)提供云服務(wù),有 望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu)化。主要劣勢:主要系 GPU 通用芯片,有大量的非必要軟硬件模塊, 1)成本價(jià)格較貴,浪費(fèi)資源,后續(xù)有望規(guī)模量產(chǎn)后實(shí)現(xiàn)快速下降;2)能效比差,后續(xù) 產(chǎn)品開發(fā)加入更多的 DLA 深度學(xué)習(xí)加速器模塊,能效比有望改善。

  5.3. Mobileye:背靠英特爾,全球自動(dòng)駕駛 AI 芯片龍頭(略)

  結(jié)論:Mobileye 屬于第 1 陣列,背靠英特爾,占據(jù) L2 級及以下市場,芯片+算法 綁定的一體式解決方案。主要優(yōu)勢:1)經(jīng)驗(yàn)豐富&質(zhì)量可靠,產(chǎn)品已經(jīng)有眾多量產(chǎn)車搭 載,質(zhì)量和適配過關(guān);2)客戶資源最豐富,國內(nèi)外絕大多數(shù)主機(jī)廠和 Tier1 級供應(yīng)商均 為其客戶;3)價(jià)格較為合理。主要劣勢:1)算力提升明顯低于其他廠商,最新 EyeQ5 算力峰值僅 24TOPS,而市場認(rèn)為 L3 級算力需求 30TOPS 以上,后期芯片僅靠提升 VMP 等手段,算力提升或難以為繼,又或者因?yàn)楦叨榷ㄖ苹槍σ曈X領(lǐng)域,減少不必要的軟 硬件資源,算力不高但性能仍滿足需求;2)黑盒子模式限制用戶創(chuàng)新,算法和芯片捆綁 銷售,或與廠商規(guī)模較小,為客戶提供定制化服務(wù),在主機(jī)廠軟件開發(fā)能力較差的初期 階段受廣泛歡迎,但隨著開發(fā)能力提升,一體銷售的靈活度較差,客戶難以做出差異性 產(chǎn)品。根據(jù)規(guī)劃 Eye Q5 或?qū)㈤_放融合算法,但感知算法并未提及。

  5.4. 華為:依托芯片,欲打造最強(qiáng)生態(tài)體系

  總結(jié):華為屬于第 1.5 陣列,憑借強(qiáng)勁的技術(shù)實(shí)力有望快速進(jìn)入第一陣列,主要針 對 L2+及以上市場,模式與 NVIDIA 類似,現(xiàn)階段對外提供平臺類產(chǎn)品(開發(fā)平臺), 而非解決方案,是國產(chǎn)品牌的優(yōu)選。主要優(yōu)勢:1)算力高,能效優(yōu),計(jì)算平臺可提供 64~350TOPS,端到端 1TOPS/W(芯片級 2TOPS/W);2)支持各種傳感器融合處理;3) 華為整體技術(shù)雄厚,生態(tài)體系有望迅速完善;依托華為從底層芯片、操作系統(tǒng)、應(yīng)用算 法、5G、云計(jì)算服務(wù)等迅速建立豐富生態(tài)體系;4)提供云服務(wù),有望獲取數(shù)據(jù)實(shí)現(xiàn)優(yōu) 化。主要劣勢:1)無量產(chǎn)車,缺乏相關(guān)的經(jīng)驗(yàn)積累,暫時(shí)無數(shù)據(jù)優(yōu)化軟件算法,搭載量 產(chǎn)車或到 2021 年底左右;2)現(xiàn)階段生態(tài)體系仍弱于英偉達(dá),所以目前華為廣交朋友圈, 依靠眾多領(lǐng)域的優(yōu)勢構(gòu)建龐大生態(tài)體系;3)客戶對其“不造車”尚持懷疑,或影響合作。

  華為芯片主要有五大系列,昇騰芯片是車端 AI 計(jì)算核心。1)麒麟芯片是手機(jī)等移 動(dòng)終端設(shè)備芯片,主要包括應(yīng)用于高端領(lǐng)域的 9 系列,包括麒麟 990、麒麟 980、麒麟 970 等。除此之外,麒麟還擁有 6 系,7 系以及 8 系等面向中低端系列的芯片;2)鯤鵬 芯片主要面向服務(wù)器領(lǐng)域,鯤鵬 920 芯片完全由華為自主研發(fā),是全球第一款 7nm 的數(shù) 據(jù)中心 ARM 處理器,主要適用于華為的泰山服務(wù)器;3)昇騰芯片是 AI 領(lǐng)域的處理器, 昇騰芯片分為云端和邊緣端兩個(gè)系列,云端(數(shù)據(jù)中心等大算力需求)為昇騰 910,邊 緣端(設(shè)備端等)為昇騰 310,現(xiàn)階段運(yùn)用車端的主要是昇騰 310;4)巴龍芯片是基帶 (通信)芯片,如支持 5G 雙模的巴龍 5000,主要應(yīng)用在麒麟 980 和麒麟 990 上,其中 麒麟 990 還推出了集成巴龍 5000 基帶芯片的版本;5)凌霄芯片是路由器芯片,其中 Hi5651 芯片是業(yè)界首款 4 核 1.4GHz 家庭路由處理芯片。

  基于昇騰 310 AI 芯片的 MDC 計(jì)算平臺是華為車端生態(tài)的堅(jiān)實(shí)根基。在 2018 年推 出 MDC 計(jì)算平臺以及高階自動(dòng)駕駛?cè)珬=鉀Q方案,包括分別對應(yīng)于 L3、L4 級自動(dòng)駕 駛的 MDC 300 和 MDC 600 平臺。MDC 集成了華為自研的 Host CPU 芯片、AI 芯片、 ISP 芯片與 SSD 控制芯片,并通過底層的軟硬件一體化調(diào)優(yōu),在時(shí)間同步、傳感器數(shù)據(jù) 精確處理、多節(jié)點(diǎn)實(shí)時(shí)通信、最小化底噪、低功耗管理、快速安全啟動(dòng)等方面業(yè)界領(lǐng)先。MDC 的核心是昇騰 310 芯片,主要用于 AI 計(jì)算。昇騰 310 是一顆 N-SOC 芯片,采用 自研達(dá)芬奇架構(gòu),算力功耗 16TOPS/8W,12nm 工藝,其主要應(yīng)用于整個(gè)邊緣端市場, 2019 年底已量產(chǎn)可提供給工業(yè)領(lǐng)域客戶。

  MDC 300 計(jì)算平臺支持 L3 級自動(dòng)駕駛。MDC 300 由華為昇騰 310 芯片、華為鯤 鵬 CPU 芯片和英飛凌的 TC397 三部分構(gòu)成,算力為 64TOPS,支持 L3 級自動(dòng)駕駛需 求,可接入 11 個(gè)攝像頭、6 個(gè)毫米波雷達(dá)、12 個(gè)超聲波雷達(dá)、6 個(gè)激光雷達(dá)。

  MDC600 計(jì)算平臺支持 L4 及以上自動(dòng)駕駛。MDC 600 包括鯤鵬 CPU+8 塊昇騰 310+ISP,支持 L4,算力為 352TOPS,支持 L4 及以上自動(dòng)駕駛,可接入 16 個(gè)攝像頭、 16 個(gè)超聲波雷達(dá)、8 個(gè)激光雷達(dá)、6 個(gè)毫米波雷達(dá)。

  MDC 是一套開放的車規(guī)級平臺,優(yōu)勢突出。1)高能效:整套計(jì)算平臺可實(shí)現(xiàn)端到 端 1TOPS/W 能效(芯片級高達(dá) 2TOPS/W 能效)。2)開放:MDC 具備組件服務(wù)化、接 口標(biāo)準(zhǔn)化、開發(fā)工具化的特性,基于此平臺可快速開發(fā)、調(diào)測、運(yùn)行自動(dòng)駕駛算法與功 能。針對不同級別的自動(dòng)駕駛算力需求,MDC 可提供一套軟件架構(gòu),不同硬件配置, 內(nèi)部支持 ROS 與 Adaptive AutoSAR 軟件架構(gòu),具備較好的跨域通信能力。3)高安全:華為的自動(dòng)駕駛?cè)珬=鉀Q方案、MDC 智能駕駛硬件平臺、車載操作系統(tǒng)鴻蒙內(nèi)核近期 均已通過 ASIL-D 功能安全認(rèn)證。

  在商業(yè)合作模式方面,華為不提供芯片級別的解決方案,只提供 MDC 系統(tǒng)級產(chǎn)品。已合作客戶包括奧迪,一汽、沃爾沃、東風(fēng)、蘇州金龍、山東浩睿智能、新石器等。

  車企面對自動(dòng)駕駛的快速開發(fā)和功能迭代,主要面臨幾大挑戰(zhàn):1)處理海量數(shù)據(jù), 成本高。一輛測試車 1 小時(shí)產(chǎn)生 8TB 數(shù)據(jù),一天按 8 小時(shí),一個(gè)月按 22 天計(jì)算,單車 將產(chǎn)生約 1.3PB /月的數(shù)據(jù),而有效數(shù)據(jù)僅為 0.05%,同時(shí)還有 80 萬張/車/天圖片待人工 標(biāo)識。2)訓(xùn)練及仿真需要優(yōu)異 AI 算法和強(qiáng)大算力。從訓(xùn)練和仿真來看,單車預(yù)計(jì)需累 積里程 100+億公里,300GPU/2 天模型訓(xùn)練,仿真測試則每天需處理 100 萬公里。3)仿 真是自動(dòng)駕駛持續(xù)提升安全的關(guān)鍵。仿真不可代替實(shí)車,但是前期開發(fā)實(shí)驗(yàn)過程仿真可 快速實(shí)現(xiàn)和減少大量試錯(cuò)成本,不僅需要大量場景支持在線仿真,同時(shí)也需要有以實(shí)車 為主的決策規(guī)劃仿真系統(tǒng)。4)工具分散不能統(tǒng)一管理?,F(xiàn)有工具多為煙囪式孤島,分 散,不利于大數(shù)據(jù)的統(tǒng)一、AI 能力的統(tǒng)一構(gòu)建,及高效運(yùn)營管理。

  華為“八爪魚”自動(dòng)駕駛云服務(wù)是基于昇騰 910AI 芯片的數(shù)據(jù)中心云服務(wù)?!鞍俗?魚”自動(dòng)駕駛云服務(wù)覆蓋自動(dòng)駕駛數(shù)據(jù)、模型、訓(xùn)練、仿真、標(biāo)注等全生命周期業(yè)務(wù), 向車企及開發(fā)者,提供了包括數(shù)據(jù)服務(wù)、訓(xùn)練服務(wù)、仿真服務(wù)在內(nèi)的 3 大服務(wù)。1)數(shù)據(jù) 服務(wù):處理車載硬件平臺上輸出的傳感器數(shù)據(jù),回放雷達(dá)、攝像頭等不同格式的數(shù)據(jù);支持 PB 級海量存儲(chǔ)、交互式大數(shù)據(jù)查詢和海量數(shù)據(jù)治理。2)訓(xùn)練服務(wù):管理和訓(xùn)練自 動(dòng)駕駛模型,不斷在新的數(shù)據(jù)集和測試集上提升模型的準(zhǔn)確度,持續(xù)提升自動(dòng)駕駛安全 系數(shù)。平臺提供軟硬件加速,能大幅縮短訓(xùn)練時(shí)間,提升訓(xùn)練效率。3)仿真服務(wù):提供 仿真、場景庫管理、場景片段、評測系統(tǒng)等應(yīng)用工具,確保自動(dòng)駕駛模型合規(guī)、安全、 可度量、質(zhì)量達(dá)標(biāo),快速集成到版本中。

  現(xiàn)階段自動(dòng)駕駛云服務(wù)供應(yīng)商主要為華為、英偉達(dá)兩家巨頭。目前數(shù)據(jù)中心云端芯 片供應(yīng)商主要包括華為、英偉達(dá)、寒武紀(jì)等,而 google、百度等均為自研內(nèi)供。其他企 業(yè)需要數(shù)據(jù)中心云服務(wù)可通過直接外購云計(jì)算服務(wù)或者自建數(shù)據(jù)中心兩種放式。

  5.5. 地平線:對標(biāo) Mobileye,AI 芯片率先搭載 UNI-T 座艙域(略)

  結(jié)論:地平線屬于強(qiáng)勢第 2 陣列,模式與 Mobileye 類似,對外主要提供解決方案 類產(chǎn)品(芯片+算法),未捆綁銷售,AI 芯片于 2020 年已搭載在長安 UNI-T 座艙域。自 動(dòng)駕駛域芯片尚未搭載量產(chǎn)車,現(xiàn)階段主要針對 L2 級及以下市場,對外提供芯片+算法 方案。主要優(yōu)勢:1)作為中立第三方,芯片和算法可分開銷售或一體式解決方案,受客 戶信任;2)國產(chǎn)芯片,國內(nèi)優(yōu)選。主要劣勢:1)現(xiàn)階段算力較低,無豐富生態(tài),創(chuàng)企 等;2)尚未通過功能安全認(rèn)證,無自動(dòng)駕駛芯片量產(chǎn)車。

  地平線成立于 2015 年 6 月,創(chuàng)始人系百度深度學(xué)習(xí)研究院院長余凱博士,學(xué)術(shù)背 景濃厚,2017 年被英特爾領(lǐng)投。2017 年 12 月發(fā)布中國首款邊緣端人工智能視覺芯片征 程(Journey)系列和旭日(Sunrise)系列。征程系列主要用于智能駕駛領(lǐng)域,旭日系列 主要用于物聯(lián)網(wǎng)領(lǐng)域。合作伙伴包括奧迪、博世、長安、比亞迪、上汽 、廣汽等國內(nèi)外 的頂級 Tier1,OEM 廠商。

  5.6. 寒武紀(jì):源于中科院,面向云邊端全領(lǐng)域(略)

  結(jié)論:寒武紀(jì)屬于第 2 陣列,或從車路協(xié)同、云服務(wù)(數(shù)據(jù)中心)等領(lǐng)域?qū)崿F(xiàn)快速 切入。主要優(yōu)勢:1)云邊端三類產(chǎn)品可從各種商業(yè)模式供應(yīng)給智能車產(chǎn)業(yè)領(lǐng)域,云端 產(chǎn)品可供應(yīng)車企/Tier 1 數(shù)據(jù)中心或提供給云服務(wù)供應(yīng)商;邊緣端產(chǎn)品供應(yīng)給政府類客戶 用于車路協(xié)同設(shè)備使用;邊緣/終端產(chǎn)品供應(yīng)給主機(jī)廠等。2)國產(chǎn)芯片,國內(nèi)優(yōu)選、中 立第三方。主要劣勢:1)與車企合作較少,無豐富生態(tài),創(chuàng)企等;2)尚未通過功能安 全認(rèn)證。

  寒武紀(jì)是智能芯片領(lǐng)域的先行者。寒武紀(jì)創(chuàng)始團(tuán)隊(duì)源于中科院,并長期致力于在人 工智能與處理器架構(gòu)交叉研究,DianNao、DaDianNao、PuDianNao、ShiDianNao、 DianNaoYu 等系列深度學(xué)習(xí)處理器架構(gòu)或指令集成果在國際學(xué)術(shù)界引起的轟動(dòng)性效應(yīng)。隨著研究成果趨于成熟,2016 年寒武紀(jì)公司成立,并著手將其芯片和指令集業(yè)務(wù)向商用 方向轉(zhuǎn)化,截止目前,寒武紀(jì)是國際上少數(shù)幾家全面系統(tǒng)掌握了智能芯片及其基礎(chǔ)系統(tǒng) 軟件研發(fā)和產(chǎn)品化核心技術(shù)的企業(yè)之一。

  寒武紀(jì)產(chǎn)品覆蓋云端、邊緣端、終端。寒武紀(jì)已面向云端、邊緣端、終端推出了三 個(gè)系列不同品類的通用型智能芯片與加速卡產(chǎn)品,以及共用相同自研指令集、處理器架 構(gòu)和基礎(chǔ)系統(tǒng)軟件平臺,完成了“云邊端一體化”建設(shè),可覆蓋人工智能領(lǐng)域高度多樣 化的應(yīng)用場景(如視覺、語音、自然語言理解、機(jī)器學(xué)習(xí)等)。

  5.7. 域控制器 AI 芯片潛在進(jìn)入者

  AI 芯片具備成為域控制器 AI 芯片的潛質(zhì):1)需要通過車規(guī)級/功能安全標(biāo)準(zhǔn);2) 算力至少應(yīng)為 TOPS 量級;3)能效比(算力/功耗)應(yīng) TOPS/W 量級;4)與主機(jī)廠或 Tier1 供應(yīng)商較長時(shí)間的合作適配等幾個(gè)特點(diǎn)。

  邊緣端芯片公司:以下廠商均未涉及汽車領(lǐng)域,更未通過車規(guī)級。比特大陸產(chǎn)品主 要用于礦機(jī)芯片,功耗過高;云天勵(lì)飛算力較低。

  云端 AI 芯片公司:1)百度、谷歌在自動(dòng)駕駛領(lǐng)域布局最多,主要針對 L4 級以上 自動(dòng)駕駛領(lǐng)域,自研硬件、算法、編程框架等。例如百度自研算法、編程框架 PaddlePadlle, 其昆侖芯片為云端芯片,目前已搭載于服務(wù)器,具備開發(fā)自動(dòng)駕駛域 AI 芯片的技術(shù)能 力。2)阿里、騰訊通過投資創(chuàng)企或設(shè)立企業(yè)進(jìn)行布局 AI 芯片,芯片主要對內(nèi)提供數(shù)據(jù) 中心云端芯片,暫不涉及自動(dòng)駕駛領(lǐng)域。3)國內(nèi)外云端創(chuàng)企如 Grop、Graphcore、依圖 科技等暫時(shí)主要針對數(shù)據(jù)中心云端芯片,短期內(nèi)無法布局更多領(lǐng)域。

  FPGA 芯片公司:主要為賽靈思(美國),深鑒科技(賽靈思收購),阿爾特拉(英 特爾收購)。整體算力較低,能效比低于 N-SOC,通用性能低于 GPU,需要 Tier 1 級供 應(yīng)商定制化芯片結(jié)構(gòu)以及提供一整套的算法應(yīng)用方案。

  傳統(tǒng)汽車電子巨頭:瑞薩電子、NXP、英飛凌、TI 等均部署自動(dòng)駕駛領(lǐng)域計(jì)算平臺 產(chǎn)品。但現(xiàn)階段提供的計(jì)算平臺產(chǎn)品仍屬于 CPU 占主導(dǎo)的范疇,AI 算力較低,而且能 耗較大。部分企業(yè)通過并購或投資 AI 芯片創(chuàng)企的方式快速切入汽車 AI 芯片領(lǐng)域。

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。