《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > AET原创 > 激光雷达进阶到图像级,智能驾驶方案之争要结束了?

激光雷达进阶到图像级,智能驾驶方案之争要结束了?

2026-03-17
來源:电子技术应用

編者按:智能駕駛領(lǐng)域的激光雷達(dá)與純視覺之爭(zhēng),本質(zhì)上確實(shí)是"硬件傳感器冗余"與"AI算力替代"兩種技術(shù)哲學(xué)的較量。"更聰明的眼睛"和"更強(qiáng)大的大腦"的博弈在2025年已進(jìn)入白熱化階段,2026年智能感知技術(shù)會(huì)倒向哪邊?融合還是更加分裂?

引言:感知技術(shù)路線的十字路口

2026年開年,智能駕駛領(lǐng)域迎來了一場(chǎng)足以改變行業(yè)格局的技術(shù)變革。華為乾崑正式發(fā)布全球量產(chǎn)最高規(guī)格的896線雙光路圖像級(jí)激光雷達(dá),標(biāo)志著車載激光雷達(dá)正式從“點(diǎn)云級(jí)”邁入“圖像級(jí)”時(shí)代。這一技術(shù)突破不僅刷新了車載感知硬件的性能天花板,更在智能輔助駕駛向高階演進(jìn)的關(guān)鍵節(jié)點(diǎn),為行業(yè)提供了感知技術(shù)的全新解決方案,開啟了車載感知技術(shù)的全新產(chǎn)業(yè)周期。

當(dāng)禾賽科技發(fā)布JT系列迷你型3D激光雷達(dá),實(shí)現(xiàn)360°×189°超半球視野并具備圖像級(jí)感知能力時(shí);當(dāng)華為ADS系統(tǒng)通過多顆激光雷達(dá)構(gòu)建起近乎完美的三維環(huán)境模型時(shí);當(dāng)特斯拉FSD V12憑借純視覺方案在懂車帝36車橫評(píng)中意外奪冠時(shí)——整個(gè)行業(yè)都在追問一個(gè)根本性問題:在激光雷達(dá)技術(shù)突飛猛進(jìn)、逐步逼近甚至超越圖像級(jí)感知精度的今天,純視覺方案僅存的成本優(yōu)勢(shì)與算法護(hù)城河,是否還能支撐其獨(dú)立存在的技術(shù)合理性?

這場(chǎng)爭(zhēng)論絕非簡(jiǎn)單的傳感器選型之爭(zhēng),而是關(guān)乎自動(dòng)駕駛技術(shù)路線、商業(yè)模式、安全哲學(xué)與產(chǎn)業(yè)生態(tài)的系統(tǒng)性博弈。從2015年激光雷達(dá)單價(jià)高達(dá)75000美元的"貴族時(shí)代",到如今500美元級(jí)別的"平民化"普及;從特斯拉堅(jiān)持"第一性原理"的純視覺信仰,到國(guó)內(nèi)車企"堆料式"的多傳感器融合策略——兩種技術(shù)路線在碰撞中演進(jìn),在競(jìng)爭(zhēng)中融合,最終指向一個(gè)核心命題:當(dāng)激光雷達(dá)跨越成本與性能的雙重門檻,純視覺方案是否還有未來?

第一章:激光雷達(dá)與純視覺方案的紛爭(zhēng)——技術(shù)哲學(xué)的分野

1.1 紛爭(zhēng)的起源:兩條路徑的底層邏輯

自動(dòng)駕駛感知技術(shù)的紛爭(zhēng),本質(zhì)上是對(duì)"機(jī)器如何理解世界"這一哲學(xué)問題的不同回答。純視覺方案信奉"仿生學(xué)至上"——既然人類僅憑雙眼就能駕駛,機(jī)器理應(yīng)也能通過攝像頭與神經(jīng)網(wǎng)絡(luò)復(fù)現(xiàn)這一能力。特斯拉CEO馬斯克曾多次公開抨擊激光雷達(dá)是"傻瓜的差事",認(rèn)為在復(fù)雜的道路環(huán)境中,增加傳感器類型只會(huì)帶來數(shù)據(jù)融合的混亂與決策的延遲。

而激光雷達(dá)陣營(yíng)則堅(jiān)持"物理測(cè)量不可逾越"的原則。他們認(rèn)為,視覺算法再?gòu)?qiáng)大,也只是對(duì)三維世界的二維投影進(jìn)行推測(cè),這種"間接感知"在數(shù)學(xué)上存在固有的信息損失。激光雷達(dá)通過發(fā)射激光脈沖并測(cè)量回波時(shí)間,直接獲取厘米級(jí)精度的三維點(diǎn)云數(shù)據(jù),這種"直接測(cè)量"在原理上就具備更高的可靠性與可解釋性。

102697.jpg

這種技術(shù)哲學(xué)的分野,在工程實(shí)踐中演化為兩種截然不同的系統(tǒng)架構(gòu):

純視覺方案的技術(shù)架構(gòu)以特斯拉FSD V12為典型代表。該系統(tǒng)采用端到端神經(jīng)網(wǎng)絡(luò)架構(gòu),將感知、決策、控制三大模塊整合為單一模型,輸入8顆120萬像素?cái)z像頭的原始圖像,直接輸出轉(zhuǎn)向、加速、制動(dòng)等控制信號(hào)。這種架構(gòu)的優(yōu)勢(shì)在于系統(tǒng)簡(jiǎn)潔、延遲低、數(shù)據(jù)利用率高;但其"黑盒"特性也帶來了可解釋性差、故障難以追溯的隱患。

多傳感器融合架構(gòu)則以華為ADS、小鵬XNGP等系統(tǒng)為代表。典型配置包括1-3顆激光雷達(dá)、5顆毫米波雷達(dá)、12顆超聲波雷達(dá)與11-13顆攝像頭。各傳感器數(shù)據(jù)在底層進(jìn)行融合,形成統(tǒng)一的環(huán)境模型后再輸入決策模塊。這種架構(gòu)雖然復(fù)雜,但具備天然的冗余性與互補(bǔ)性——當(dāng)攝像頭在強(qiáng)光下失效時(shí),激光雷達(dá)仍可工作;當(dāng)激光雷達(dá)被雨雪干擾時(shí),視覺算法可填補(bǔ)空白。

1.2 紛爭(zhēng)的激化:成本下降與性能躍升的雙重沖擊

2024-2025年,激光雷達(dá)行業(yè)經(jīng)歷了前所未有的技術(shù)爆發(fā)與成本崩塌。禾賽科技、速騰聚創(chuàng)等國(guó)內(nèi)廠商通過芯片化、固態(tài)化技術(shù)路徑,將激光雷達(dá)價(jià)格從數(shù)萬元壓縮至數(shù)千元區(qū)間。與此同時(shí),線數(shù)從早期的16線、64線躍升至512線甚至1000線,角分辨率逼近0.1度,探測(cè)距離延伸至300米以上,點(diǎn)云密度達(dá)到圖像級(jí)水平。

這種"性能躍升+成本下降"的組合拳,直接沖擊了純視覺方案的核心護(hù)城河。特斯拉選擇純視覺路線的歷史背景,是早期激光雷達(dá)高達(dá)75000美元的天價(jià),以及其自研FSD芯片帶來的算力優(yōu)勢(shì)。但當(dāng)激光雷達(dá)成本降至500美元以下,且國(guó)內(nèi)車企可通過供應(yīng)鏈優(yōu)勢(shì)獲得同等算力平臺(tái)時(shí),特斯拉的"成本領(lǐng)先"策略面臨失效風(fēng)險(xiǎn)。

更關(guān)鍵的是,激光雷達(dá)的"圖像級(jí)"進(jìn)化正在模糊兩種方案的界限。傳統(tǒng)激光雷達(dá)輸出的是稀疏點(diǎn)云,需要與攝像頭圖像融合才能理解物體語(yǔ)義。而新一代固態(tài)激光雷達(dá)可輸出高密度、帶反射強(qiáng)度信息的點(diǎn)云,其數(shù)據(jù)格式與圖像高度相似,可直接輸入深度學(xué)習(xí)模型進(jìn)行處理。這意味著激光雷達(dá)不再僅僅是"測(cè)距工具",而是成為了具備三維感知能力的"超級(jí)攝像頭"。

1.3 紛爭(zhēng)的本質(zhì):數(shù)據(jù)效率與物理極限的博弈

這場(chǎng)紛爭(zhēng)的深層邏輯,是"數(shù)據(jù)驅(qū)動(dòng)"與"物理驅(qū)動(dòng)"兩種方法論的競(jìng)爭(zhēng)。純視覺方案相信,只要有足夠多的數(shù)據(jù)(特斯拉已積累48億公里路測(cè)數(shù)據(jù)),神經(jīng)網(wǎng)絡(luò)就能學(xué)會(huì)從二維圖像中準(zhǔn)確重建三維世界,彌補(bǔ)硬件的物理局限。而激光雷達(dá)陣營(yíng)則認(rèn)為,無論如何訓(xùn)練算法,都無法突破"二維投影損失深度信息"的數(shù)學(xué)本質(zhì),唯有直接測(cè)量才能確保極端場(chǎng)景下的可靠性。

2025年懂車帝的36車橫評(píng)結(jié)果,為這場(chǎng)博弈增添了戲劇性轉(zhuǎn)折。特斯拉Model Y憑借純視覺方案在多項(xiàng)測(cè)試中奪冠,甚至在動(dòng)態(tài)物體軌跡預(yù)測(cè)精度上領(lǐng)先激光雷達(dá)車型17%。這一結(jié)果似乎印證了"數(shù)據(jù)>硬件"的論斷——當(dāng)算法能力存在代際差距時(shí),單純的硬件堆砌難以彌補(bǔ)系統(tǒng)在復(fù)雜場(chǎng)景下的核心缺陷。

但爭(zhēng)議隨之而來。批評(píng)者指出,測(cè)試場(chǎng)景仍屬于"已知領(lǐng)域",而在真正的長(zhǎng)尾場(chǎng)景(如施工區(qū)復(fù)雜路障、貨車散落雜物、夜間野生動(dòng)物穿行)中,純視覺方案的"幻覺"問題(將廣告牌誤判為障礙物,或忽略躺在車底的摩托車手)可能帶來致命風(fēng)險(xiǎn)。激光雷達(dá)提供的三維點(diǎn)云,在這些極端場(chǎng)景下是最后的安全防線。

第二章:優(yōu)劣勢(shì)對(duì)比——技術(shù)特性的全維度解析

2.1 純視覺方案的優(yōu)勢(shì)與局限

核心優(yōu)勢(shì):

成本優(yōu)勢(shì)是純視覺方案最顯著的標(biāo)簽。特斯拉的硬件配置僅包括8顆普通攝像頭,單個(gè)成本不足百元,整體感知硬件成本控制在500-6000元區(qū)間。相比之下,搭載3顆激光雷達(dá)的問界M9,感知硬件成本高達(dá)約2萬元。這種成本差異在20萬元以下的大眾市場(chǎng)具有決定性意義。

數(shù)據(jù)一致性是另一大優(yōu)勢(shì)。純視覺方案處理的是統(tǒng)一格式的圖像數(shù)據(jù),避免了多傳感器融合中的時(shí)間同步、空間標(biāo)定與數(shù)據(jù)對(duì)齊難題。特斯拉FSD V12的端到端架構(gòu),直接將圖像像素映射到控制信號(hào),系統(tǒng)延遲顯著低于多傳感器融合方案。

語(yǔ)義理解能力是視覺算法的強(qiáng)項(xiàng)。攝像頭捕捉的RGB圖像包含豐富的紋理、顏色與文字信息,這對(duì)于識(shí)別交通標(biāo)志、車道線、紅綠燈狀態(tài)至關(guān)重要。人類道路環(huán)境本質(zhì)上是"為眼睛設(shè)計(jì)的交互場(chǎng)景",視覺算法可直接利用這一先驗(yàn)知識(shí)。

致命局限:

光照敏感性是視覺方案的原罪。在強(qiáng)逆光、夜間無路燈、暴雨、沙塵等場(chǎng)景下,攝像頭圖像可能出現(xiàn)過曝、欠曝或嚴(yán)重噪聲,導(dǎo)致后端算法失效。雖然特斯拉通過高動(dòng)態(tài)范圍(HDR)傳感器與光學(xué)畸變校正算法緩解了部分問題,但在極端天氣下的性能衰減仍無法避免。

深度估計(jì)的固有誤差是數(shù)學(xué)層面的局限。從單目或雙目圖像中恢復(fù)深度信息,是一個(gè)病態(tài)(ill-posed)問題——無窮多種三維場(chǎng)景可對(duì)應(yīng)同一幅二維圖像。雖然深度學(xué)習(xí)可通過數(shù)據(jù)驅(qū)動(dòng)方式"猜測(cè)"深度,但這種猜測(cè)在未知場(chǎng)景下存在系統(tǒng)性偏差,可能導(dǎo)致將遠(yuǎn)處的大卡車誤判為近處的小轎車,或反之。

長(zhǎng)尾場(chǎng)景的脆弱性是安全層面的隱患。純視覺系統(tǒng)依賴訓(xùn)練數(shù)據(jù)的覆蓋度,對(duì)于未在訓(xùn)練集中出現(xiàn)的罕見物體(如異形障礙物、特殊涂裝車輛),可能出現(xiàn)災(zāi)難性的漏檢或誤檢。2024年多起特斯拉FSD事故,均涉及系統(tǒng)將廣告牌、陰影或路面反光誤判為實(shí)體障礙物。

2.2 激光雷達(dá)方案的優(yōu)勢(shì)與挑戰(zhàn)

核心優(yōu)勢(shì):

厘米級(jí)測(cè)距精度是激光雷達(dá)的技術(shù)基石。通過測(cè)量激光脈沖的飛行時(shí)間(ToF)或調(diào)頻連續(xù)波(FMCW)的相位差,激光雷達(dá)可直接獲取物體表面的精確距離,精度通常可達(dá)厘米級(jí)。這種"直接測(cè)量"不受光照條件影響,在夜間或逆光環(huán)境下性能穩(wěn)定。

三維環(huán)境建模能力是激光雷達(dá)的殺手锏。激光雷達(dá)輸出的點(diǎn)云數(shù)據(jù)天然包含三維坐標(biāo)信息,可直接構(gòu)建周圍環(huán)境的立體模型,無需像視覺方案那樣通過復(fù)雜的深度估計(jì)網(wǎng)絡(luò)"推測(cè)"深度。這種能力對(duì)于障礙物檢測(cè)、可通行區(qū)域分析、高精度定位至關(guān)重要。

多傳感器融合的樞紐作用是系統(tǒng)架構(gòu)層面的優(yōu)勢(shì)。在多傳感器融合方案中,激光雷達(dá)通常作為"主傳感器",提供精確的幾何基準(zhǔn);攝像頭提供語(yǔ)義信息,毫米波雷達(dá)提供速度信息。這種分層融合架構(gòu)具備更高的可解釋性與故障隔離能力——當(dāng)某一傳感器失效時(shí),系統(tǒng)可明確知曉并啟動(dòng)降級(jí)策略。

現(xiàn)實(shí)挑戰(zhàn):

成本與體積雖已大幅改善,但仍高于攝像頭。雖然固態(tài)激光雷達(dá)價(jià)格已降至500美元級(jí)別,但相較于幾十美元的攝像頭,仍存在數(shù)量級(jí)差距。此外,激光雷達(dá)的安裝位置(通常位于車頂或前格柵)對(duì)車輛造型與空氣動(dòng)力學(xué)的影響,也是車企需要考慮的因素。

惡劣天氣性能衰減是物理層面的局限。雨滴、雪花、沙塵顆粒會(huì)對(duì)激光束產(chǎn)生散射與吸收,導(dǎo)致點(diǎn)云中出現(xiàn)噪聲點(diǎn)或探測(cè)距離縮短。雖然新一代激光雷達(dá)通過算法濾波與多回波技術(shù)緩解了這一問題,但在暴雨或暴雪天氣下的性能仍會(huì)下降20%左右。

數(shù)據(jù)稀疏性與語(yǔ)義鴻溝是傳統(tǒng)激光雷達(dá)的軟肋。早期激光雷達(dá)點(diǎn)云稀疏(如16線激光雷達(dá)每秒僅輸出數(shù)萬點(diǎn)),難以識(shí)別物體細(xì)節(jié);且點(diǎn)云缺乏顏色與紋理信息,無法直接區(qū)分紅色交通燈與綠色交通燈。雖然圖像級(jí)激光雷達(dá)(如512線以上產(chǎn)品)已大幅改善點(diǎn)云密度,但語(yǔ)義理解仍需與攝像頭融合。

2.3 技術(shù)融合的新趨勢(shì):圖像級(jí)激光雷達(dá)的崛起

2025年,激光雷達(dá)技術(shù)的"圖像級(jí)"進(jìn)化正在重塑競(jìng)爭(zhēng)格局。以禾賽JT系列、速騰聚創(chuàng)M系列為代表的新一代產(chǎn)品,通過芯片化架構(gòu)將線數(shù)提升至512線以上,點(diǎn)云密度達(dá)到每秒數(shù)百萬點(diǎn),角分辨率逼近0.1度。這種高密度點(diǎn)云已接近攝像頭圖像的信息密度,可直接輸入深度學(xué)習(xí)模型進(jìn)行語(yǔ)義分割與目標(biāo)檢測(cè),無需依賴攝像頭輔助。

更關(guān)鍵的是,4D成像雷達(dá)與固態(tài)激光雷達(dá)的成熟,正在構(gòu)建"全固態(tài)、高分辨率、低成本"的感知新范式。4D成像雷達(dá)在傳統(tǒng)毫米波雷達(dá)基礎(chǔ)上增加了高度維信息,可輸出類似激光雷達(dá)的點(diǎn)云,但成本更低、穿透性更強(qiáng);固態(tài)激光雷達(dá)則通過芯片化光學(xué)相控陣(OPA)或微機(jī)電系統(tǒng)(MEMS)取代機(jī)械旋轉(zhuǎn)結(jié)構(gòu),可靠性大幅提升。

這種技術(shù)演進(jìn)意味著,激光雷達(dá)正在從"昂貴的測(cè)距工具"進(jìn)化為"高精度的三維攝像頭",其數(shù)據(jù)格式與處理流程日益趨同于視覺算法。當(dāng)激光雷達(dá)能夠獨(dú)立輸出"圖像級(jí)"的三維語(yǔ)義信息時(shí),純視覺方案在語(yǔ)義理解方面的最后優(yōu)勢(shì)也將被侵蝕。

第三章:國(guó)內(nèi)外廠商的技術(shù)路線選擇——戰(zhàn)略分野與市場(chǎng)博弈

3.1 特斯拉:純視覺路線的孤勇者

特斯拉是純視覺路線最堅(jiān)定的捍衛(wèi)者,其技術(shù)選擇具有深刻的歷史與戰(zhàn)略背景。早在2015年,激光雷達(dá)價(jià)格高達(dá)75000美元時(shí),特斯拉就認(rèn)定這一成本無法支撐大規(guī)模商業(yè)化。彼時(shí),特斯拉選擇了一條"算法補(bǔ)硬件"的路徑:通過自研FSD芯片(單顆算力144TOPS,遠(yuǎn)超同期國(guó)產(chǎn)芯片的30-50TOPS)與海量數(shù)據(jù)訓(xùn)練(48億公里路測(cè)數(shù)據(jù)),構(gòu)建起純視覺感知的能力護(hù)城河。

特斯拉的端到端架構(gòu)(FSD V12)代表了純視覺路線的技術(shù)巔峰。該系統(tǒng)將感知、決策、控制整合為單一神經(jīng)網(wǎng)絡(luò),輸入8顆攝像頭的原始圖像,直接輸出車輛控制信號(hào)。這種架構(gòu)的優(yōu)勢(shì)在于系統(tǒng)簡(jiǎn)潔、響應(yīng)迅速、數(shù)據(jù)利用率高——每一次人工接管都可作為訓(xùn)練樣本,直接優(yōu)化整個(gè)端到端模型。

然而,特斯拉的"中國(guó)困境"也暴露了純視覺路線的局限性。2025年FSD入華后,在面對(duì)中國(guó)特色的"右側(cè)左轉(zhuǎn)車道"、"加塞文化"、"異形障礙物"等場(chǎng)景時(shí),系統(tǒng)表現(xiàn)出現(xiàn)明顯水土不服。這印證了純視覺方案的核心弱點(diǎn):其性能高度依賴訓(xùn)練數(shù)據(jù)的覆蓋度,在數(shù)據(jù)稀疏的陌生地域,算法泛化能力面臨嚴(yán)峻考驗(yàn)。

3.2 國(guó)內(nèi)車企:激光雷達(dá)+視覺的融合派

與特斯拉的"極簡(jiǎn)主義"形成鮮明對(duì)比,國(guó)內(nèi)主流車企(華為、小鵬、蔚來、理想等)普遍采用"激光雷達(dá)+攝像頭+毫米波雷達(dá)"的多傳感器融合方案。這種選擇并非技術(shù)保守,而是基于中國(guó)復(fù)雜路況的務(wù)實(shí)考量。

華為ADS是融合方案的典型代表。以問界M9為例,其搭載3顆華為自研192線激光雷達(dá)(后升級(jí)為更高線數(shù)產(chǎn)品)、11顆攝像頭、6顆毫米波雷達(dá)與12顆超聲波雷達(dá),構(gòu)建起360度無死角的感知網(wǎng)絡(luò)。華為的核心競(jìng)爭(zhēng)力在于"全棧自研"——從激光雷達(dá)、毫米波雷達(dá)、攝像頭等傳感器,到MDC計(jì)算平臺(tái)、鴻蒙座艙、ADS算法,形成完整的垂直整合能力。

小鵬XNGP則代表了"重感知、輕地圖"的技術(shù)路線。通過2顆激光雷達(dá)、11顆攝像頭、5顆毫米波雷達(dá)與12顆超聲波雷達(dá)的組合,小鵬實(shí)現(xiàn)了不依賴高精地圖的城市NOA功能。這種方案降低了對(duì)高精地圖的依賴(地圖更新周期通常長(zhǎng)達(dá)3個(gè)月,而城市道路施工可能3天就變),提升了系統(tǒng)的泛化能力。

比亞迪的技術(shù)路線更為分層:高端車型(如仰望U8)搭載激光雷達(dá)實(shí)現(xiàn)高階智駕,而20萬元以下車型則采用"天神之眼C"純視覺方案(5顆毫米波雷達(dá)+12顆攝像頭+12顆超聲波雷達(dá))。這種"高低搭配"策略,體現(xiàn)了成本敏感市場(chǎng)對(duì)純視覺方案的剛性需求。

3.3 國(guó)際廠商的分化:從Waymo到Mobileye

在國(guó)際市場(chǎng),技術(shù)路線選擇呈現(xiàn)明顯的場(chǎng)景分化:

Robotaxi運(yùn)營(yíng)商(Waymo、Cruise、百度Apollo)普遍采用"極致冗余"的多傳感器方案。Waymo的第五代系統(tǒng)搭載5顆激光雷達(dá)、29顆攝像頭、6顆毫米波雷達(dá),甚至包括音頻檢測(cè)系統(tǒng),以確保在完全無人駕駛場(chǎng)景下的絕對(duì)安全。對(duì)于這些運(yùn)營(yíng)商而言,硬件成本可被服務(wù)收入攤薄,而安全事故的代價(jià)則是毀滅性的。

傳統(tǒng)車企(奔馳、寶馬、奧迪)則采取漸進(jìn)式策略。奔馳Drive Pilot(L3級(jí))采用激光雷達(dá)+攝像頭+毫米波雷達(dá)的融合方案,但僅在高速公路等限定場(chǎng)景啟用;寶馬、奧迪的高階智駕系統(tǒng)同樣依賴激光雷達(dá),但功能釋放更為保守。

Mobileye作為視覺算法起家的供應(yīng)商,正逐步向融合方案轉(zhuǎn)型。其EyeQ6芯片平臺(tái)支持接入激光雷達(dá),SuperVision系統(tǒng)已開始部署多傳感器融合方案,顯示出純視覺路線在高端市場(chǎng)的局限性。

轉(zhuǎn)下文:當(dāng)激光雷達(dá)成為智能駕駛"標(biāo)配",純視覺將何去何從?>>

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。