《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > AET原创 > 激光雷达进阶到图像级,智能驾驶方案之争要结束了?

激光雷达进阶到图像级,智能驾驶方案之争要结束了?

2026-03-17
來源:电子技术应用

編者按:智能駕駛領(lǐng)域的激光雷達(dá)與純視覺之爭,本質(zhì)上確實(shí)是"硬件傳感器冗余"與"AI算力替代"兩種技術(shù)哲學(xué)的較量。"更聰明的眼睛"和"更強(qiáng)大的大腦"的博弈在2025年已進(jìn)入白熱化階段,2026年智能感知技術(shù)會倒向哪邊?融合還是更加分裂?

引言:感知技術(shù)路線的十字路口

2026年開年,智能駕駛領(lǐng)域迎來了一場足以改變行業(yè)格局的技術(shù)變革。華為乾崑正式發(fā)布全球量產(chǎn)最高規(guī)格的896線雙光路圖像級激光雷達(dá),標(biāo)志著車載激光雷達(dá)正式從“點(diǎn)云級”邁入“圖像級”時代。這一技術(shù)突破不僅刷新了車載感知硬件的性能天花板,更在智能輔助駕駛向高階演進(jìn)的關(guān)鍵節(jié)點(diǎn),為行業(yè)提供了感知技術(shù)的全新解決方案,開啟了車載感知技術(shù)的全新產(chǎn)業(yè)周期。

當(dāng)禾賽科技發(fā)布JT系列迷你型3D激光雷達(dá),實(shí)現(xiàn)360°×189°超半球視野并具備圖像級感知能力時;當(dāng)華為ADS系統(tǒng)通過多顆激光雷達(dá)構(gòu)建起近乎完美的三維環(huán)境模型時;當(dāng)特斯拉FSD V12憑借純視覺方案在懂車帝36車橫評中意外奪冠時——整個行業(yè)都在追問一個根本性問題:在激光雷達(dá)技術(shù)突飛猛進(jìn)、逐步逼近甚至超越圖像級感知精度的今天,純視覺方案僅存的成本優(yōu)勢與算法護(hù)城河,是否還能支撐其獨(dú)立存在的技術(shù)合理性?

這場爭論絕非簡單的傳感器選型之爭,而是關(guān)乎自動駕駛技術(shù)路線、商業(yè)模式、安全哲學(xué)與產(chǎn)業(yè)生態(tài)的系統(tǒng)性博弈。從2015年激光雷達(dá)單價高達(dá)75000美元的"貴族時代",到如今500美元級別的"平民化"普及;從特斯拉堅(jiān)持"第一性原理"的純視覺信仰,到國內(nèi)車企"堆料式"的多傳感器融合策略——兩種技術(shù)路線在碰撞中演進(jìn),在競爭中融合,最終指向一個核心命題:當(dāng)激光雷達(dá)跨越成本與性能的雙重門檻,純視覺方案是否還有未來?

第一章:激光雷達(dá)與純視覺方案的紛爭——技術(shù)哲學(xué)的分野

1.1 紛爭的起源:兩條路徑的底層邏輯

自動駕駛感知技術(shù)的紛爭,本質(zhì)上是對"機(jī)器如何理解世界"這一哲學(xué)問題的不同回答。純視覺方案信奉"仿生學(xué)至上"——既然人類僅憑雙眼就能駕駛,機(jī)器理應(yīng)也能通過攝像頭與神經(jīng)網(wǎng)絡(luò)復(fù)現(xiàn)這一能力。特斯拉CEO馬斯克曾多次公開抨擊激光雷達(dá)是"傻瓜的差事",認(rèn)為在復(fù)雜的道路環(huán)境中,增加傳感器類型只會帶來數(shù)據(jù)融合的混亂與決策的延遲。

而激光雷達(dá)陣營則堅(jiān)持"物理測量不可逾越"的原則。他們認(rèn)為,視覺算法再強(qiáng)大,也只是對三維世界的二維投影進(jìn)行推測,這種"間接感知"在數(shù)學(xué)上存在固有的信息損失。激光雷達(dá)通過發(fā)射激光脈沖并測量回波時間,直接獲取厘米級精度的三維點(diǎn)云數(shù)據(jù),這種"直接測量"在原理上就具備更高的可靠性與可解釋性。

102697.jpg

這種技術(shù)哲學(xué)的分野,在工程實(shí)踐中演化為兩種截然不同的系統(tǒng)架構(gòu):

純視覺方案的技術(shù)架構(gòu)以特斯拉FSD V12為典型代表。該系統(tǒng)采用端到端神經(jīng)網(wǎng)絡(luò)架構(gòu),將感知、決策、控制三大模塊整合為單一模型,輸入8顆120萬像素攝像頭的原始圖像,直接輸出轉(zhuǎn)向、加速、制動等控制信號。這種架構(gòu)的優(yōu)勢在于系統(tǒng)簡潔、延遲低、數(shù)據(jù)利用率高;但其"黑盒"特性也帶來了可解釋性差、故障難以追溯的隱患。

多傳感器融合架構(gòu)則以華為ADS、小鵬XNGP等系統(tǒng)為代表。典型配置包括1-3顆激光雷達(dá)、5顆毫米波雷達(dá)、12顆超聲波雷達(dá)與11-13顆攝像頭。各傳感器數(shù)據(jù)在底層進(jìn)行融合,形成統(tǒng)一的環(huán)境模型后再輸入決策模塊。這種架構(gòu)雖然復(fù)雜,但具備天然的冗余性與互補(bǔ)性——當(dāng)攝像頭在強(qiáng)光下失效時,激光雷達(dá)仍可工作;當(dāng)激光雷達(dá)被雨雪干擾時,視覺算法可填補(bǔ)空白。

1.2 紛爭的激化:成本下降與性能躍升的雙重沖擊

2024-2025年,激光雷達(dá)行業(yè)經(jīng)歷了前所未有的技術(shù)爆發(fā)與成本崩塌。禾賽科技、速騰聚創(chuàng)等國內(nèi)廠商通過芯片化、固態(tài)化技術(shù)路徑,將激光雷達(dá)價格從數(shù)萬元壓縮至數(shù)千元區(qū)間。與此同時,線數(shù)從早期的16線、64線躍升至512線甚至1000線,角分辨率逼近0.1度,探測距離延伸至300米以上,點(diǎn)云密度達(dá)到圖像級水平。

這種"性能躍升+成本下降"的組合拳,直接沖擊了純視覺方案的核心護(hù)城河。特斯拉選擇純視覺路線的歷史背景,是早期激光雷達(dá)高達(dá)75000美元的天價,以及其自研FSD芯片帶來的算力優(yōu)勢。但當(dāng)激光雷達(dá)成本降至500美元以下,且國內(nèi)車企可通過供應(yīng)鏈優(yōu)勢獲得同等算力平臺時,特斯拉的"成本領(lǐng)先"策略面臨失效風(fēng)險。

更關(guān)鍵的是,激光雷達(dá)的"圖像級"進(jìn)化正在模糊兩種方案的界限。傳統(tǒng)激光雷達(dá)輸出的是稀疏點(diǎn)云,需要與攝像頭圖像融合才能理解物體語義。而新一代固態(tài)激光雷達(dá)可輸出高密度、帶反射強(qiáng)度信息的點(diǎn)云,其數(shù)據(jù)格式與圖像高度相似,可直接輸入深度學(xué)習(xí)模型進(jìn)行處理。這意味著激光雷達(dá)不再僅僅是"測距工具",而是成為了具備三維感知能力的"超級攝像頭"。

1.3 紛爭的本質(zhì):數(shù)據(jù)效率與物理極限的博弈

這場紛爭的深層邏輯,是"數(shù)據(jù)驅(qū)動"與"物理驅(qū)動"兩種方法論的競爭。純視覺方案相信,只要有足夠多的數(shù)據(jù)(特斯拉已積累48億公里路測數(shù)據(jù)),神經(jīng)網(wǎng)絡(luò)就能學(xué)會從二維圖像中準(zhǔn)確重建三維世界,彌補(bǔ)硬件的物理局限。而激光雷達(dá)陣營則認(rèn)為,無論如何訓(xùn)練算法,都無法突破"二維投影損失深度信息"的數(shù)學(xué)本質(zhì),唯有直接測量才能確保極端場景下的可靠性。

2025年懂車帝的36車橫評結(jié)果,為這場博弈增添了戲劇性轉(zhuǎn)折。特斯拉Model Y憑借純視覺方案在多項(xiàng)測試中奪冠,甚至在動態(tài)物體軌跡預(yù)測精度上領(lǐng)先激光雷達(dá)車型17%。這一結(jié)果似乎印證了"數(shù)據(jù)>硬件"的論斷——當(dāng)算法能力存在代際差距時,單純的硬件堆砌難以彌補(bǔ)系統(tǒng)在復(fù)雜場景下的核心缺陷。

但爭議隨之而來。批評者指出,測試場景仍屬于"已知領(lǐng)域",而在真正的長尾場景(如施工區(qū)復(fù)雜路障、貨車散落雜物、夜間野生動物穿行)中,純視覺方案的"幻覺"問題(將廣告牌誤判為障礙物,或忽略躺在車底的摩托車手)可能帶來致命風(fēng)險。激光雷達(dá)提供的三維點(diǎn)云,在這些極端場景下是最后的安全防線。

第二章:優(yōu)劣勢對比——技術(shù)特性的全維度解析

2.1 純視覺方案的優(yōu)勢與局限

核心優(yōu)勢:

成本優(yōu)勢是純視覺方案最顯著的標(biāo)簽。特斯拉的硬件配置僅包括8顆普通攝像頭,單個成本不足百元,整體感知硬件成本控制在500-6000元區(qū)間。相比之下,搭載3顆激光雷達(dá)的問界M9,感知硬件成本高達(dá)約2萬元。這種成本差異在20萬元以下的大眾市場具有決定性意義。

數(shù)據(jù)一致性是另一大優(yōu)勢。純視覺方案處理的是統(tǒng)一格式的圖像數(shù)據(jù),避免了多傳感器融合中的時間同步、空間標(biāo)定與數(shù)據(jù)對齊難題。特斯拉FSD V12的端到端架構(gòu),直接將圖像像素映射到控制信號,系統(tǒng)延遲顯著低于多傳感器融合方案。

語義理解能力是視覺算法的強(qiáng)項(xiàng)。攝像頭捕捉的RGB圖像包含豐富的紋理、顏色與文字信息,這對于識別交通標(biāo)志、車道線、紅綠燈狀態(tài)至關(guān)重要。人類道路環(huán)境本質(zhì)上是"為眼睛設(shè)計的交互場景",視覺算法可直接利用這一先驗(yàn)知識。

致命局限:

光照敏感性是視覺方案的原罪。在強(qiáng)逆光、夜間無路燈、暴雨、沙塵等場景下,攝像頭圖像可能出現(xiàn)過曝、欠曝或嚴(yán)重噪聲,導(dǎo)致后端算法失效。雖然特斯拉通過高動態(tài)范圍(HDR)傳感器與光學(xué)畸變校正算法緩解了部分問題,但在極端天氣下的性能衰減仍無法避免。

深度估計的固有誤差是數(shù)學(xué)層面的局限。從單目或雙目圖像中恢復(fù)深度信息,是一個病態(tài)(ill-posed)問題——無窮多種三維場景可對應(yīng)同一幅二維圖像。雖然深度學(xué)習(xí)可通過數(shù)據(jù)驅(qū)動方式"猜測"深度,但這種猜測在未知場景下存在系統(tǒng)性偏差,可能導(dǎo)致將遠(yuǎn)處的大卡車誤判為近處的小轎車,或反之。

長尾場景的脆弱性是安全層面的隱患。純視覺系統(tǒng)依賴訓(xùn)練數(shù)據(jù)的覆蓋度,對于未在訓(xùn)練集中出現(xiàn)的罕見物體(如異形障礙物、特殊涂裝車輛),可能出現(xiàn)災(zāi)難性的漏檢或誤檢。2024年多起特斯拉FSD事故,均涉及系統(tǒng)將廣告牌、陰影或路面反光誤判為實(shí)體障礙物。

2.2 激光雷達(dá)方案的優(yōu)勢與挑戰(zhàn)

核心優(yōu)勢:

厘米級測距精度是激光雷達(dá)的技術(shù)基石。通過測量激光脈沖的飛行時間(ToF)或調(diào)頻連續(xù)波(FMCW)的相位差,激光雷達(dá)可直接獲取物體表面的精確距離,精度通??蛇_(dá)厘米級。這種"直接測量"不受光照條件影響,在夜間或逆光環(huán)境下性能穩(wěn)定。

三維環(huán)境建模能力是激光雷達(dá)的殺手锏。激光雷達(dá)輸出的點(diǎn)云數(shù)據(jù)天然包含三維坐標(biāo)信息,可直接構(gòu)建周圍環(huán)境的立體模型,無需像視覺方案那樣通過復(fù)雜的深度估計網(wǎng)絡(luò)"推測"深度。這種能力對于障礙物檢測、可通行區(qū)域分析、高精度定位至關(guān)重要。

多傳感器融合的樞紐作用是系統(tǒng)架構(gòu)層面的優(yōu)勢。在多傳感器融合方案中,激光雷達(dá)通常作為"主傳感器",提供精確的幾何基準(zhǔn);攝像頭提供語義信息,毫米波雷達(dá)提供速度信息。這種分層融合架構(gòu)具備更高的可解釋性與故障隔離能力——當(dāng)某一傳感器失效時,系統(tǒng)可明確知曉并啟動降級策略。

現(xiàn)實(shí)挑戰(zhàn):

成本與體積雖已大幅改善,但仍高于攝像頭。雖然固態(tài)激光雷達(dá)價格已降至500美元級別,但相較于幾十美元的攝像頭,仍存在數(shù)量級差距。此外,激光雷達(dá)的安裝位置(通常位于車頂或前格柵)對車輛造型與空氣動力學(xué)的影響,也是車企需要考慮的因素。

惡劣天氣性能衰減是物理層面的局限。雨滴、雪花、沙塵顆粒會對激光束產(chǎn)生散射與吸收,導(dǎo)致點(diǎn)云中出現(xiàn)噪聲點(diǎn)或探測距離縮短。雖然新一代激光雷達(dá)通過算法濾波與多回波技術(shù)緩解了這一問題,但在暴雨或暴雪天氣下的性能仍會下降20%左右。

數(shù)據(jù)稀疏性與語義鴻溝是傳統(tǒng)激光雷達(dá)的軟肋。早期激光雷達(dá)點(diǎn)云稀疏(如16線激光雷達(dá)每秒僅輸出數(shù)萬點(diǎn)),難以識別物體細(xì)節(jié);且點(diǎn)云缺乏顏色與紋理信息,無法直接區(qū)分紅色交通燈與綠色交通燈。雖然圖像級激光雷達(dá)(如512線以上產(chǎn)品)已大幅改善點(diǎn)云密度,但語義理解仍需與攝像頭融合。

2.3 技術(shù)融合的新趨勢:圖像級激光雷達(dá)的崛起

2025年,激光雷達(dá)技術(shù)的"圖像級"進(jìn)化正在重塑競爭格局。以禾賽JT系列、速騰聚創(chuàng)M系列為代表的新一代產(chǎn)品,通過芯片化架構(gòu)將線數(shù)提升至512線以上,點(diǎn)云密度達(dá)到每秒數(shù)百萬點(diǎn),角分辨率逼近0.1度。這種高密度點(diǎn)云已接近攝像頭圖像的信息密度,可直接輸入深度學(xué)習(xí)模型進(jìn)行語義分割與目標(biāo)檢測,無需依賴攝像頭輔助。

更關(guān)鍵的是,4D成像雷達(dá)與固態(tài)激光雷達(dá)的成熟,正在構(gòu)建"全固態(tài)、高分辨率、低成本"的感知新范式。4D成像雷達(dá)在傳統(tǒng)毫米波雷達(dá)基礎(chǔ)上增加了高度維信息,可輸出類似激光雷達(dá)的點(diǎn)云,但成本更低、穿透性更強(qiáng);固態(tài)激光雷達(dá)則通過芯片化光學(xué)相控陣(OPA)或微機(jī)電系統(tǒng)(MEMS)取代機(jī)械旋轉(zhuǎn)結(jié)構(gòu),可靠性大幅提升。

這種技術(shù)演進(jìn)意味著,激光雷達(dá)正在從"昂貴的測距工具"進(jìn)化為"高精度的三維攝像頭",其數(shù)據(jù)格式與處理流程日益趨同于視覺算法。當(dāng)激光雷達(dá)能夠獨(dú)立輸出"圖像級"的三維語義信息時,純視覺方案在語義理解方面的最后優(yōu)勢也將被侵蝕。

第三章:國內(nèi)外廠商的技術(shù)路線選擇——戰(zhàn)略分野與市場博弈

3.1 特斯拉:純視覺路線的孤勇者

特斯拉是純視覺路線最堅(jiān)定的捍衛(wèi)者,其技術(shù)選擇具有深刻的歷史與戰(zhàn)略背景。早在2015年,激光雷達(dá)價格高達(dá)75000美元時,特斯拉就認(rèn)定這一成本無法支撐大規(guī)模商業(yè)化。彼時,特斯拉選擇了一條"算法補(bǔ)硬件"的路徑:通過自研FSD芯片(單顆算力144TOPS,遠(yuǎn)超同期國產(chǎn)芯片的30-50TOPS)與海量數(shù)據(jù)訓(xùn)練(48億公里路測數(shù)據(jù)),構(gòu)建起純視覺感知的能力護(hù)城河。

特斯拉的端到端架構(gòu)(FSD V12)代表了純視覺路線的技術(shù)巔峰。該系統(tǒng)將感知、決策、控制整合為單一神經(jīng)網(wǎng)絡(luò),輸入8顆攝像頭的原始圖像,直接輸出車輛控制信號。這種架構(gòu)的優(yōu)勢在于系統(tǒng)簡潔、響應(yīng)迅速、數(shù)據(jù)利用率高——每一次人工接管都可作為訓(xùn)練樣本,直接優(yōu)化整個端到端模型。

然而,特斯拉的"中國困境"也暴露了純視覺路線的局限性。2025年FSD入華后,在面對中國特色的"右側(cè)左轉(zhuǎn)車道"、"加塞文化"、"異形障礙物"等場景時,系統(tǒng)表現(xiàn)出現(xiàn)明顯水土不服。這印證了純視覺方案的核心弱點(diǎn):其性能高度依賴訓(xùn)練數(shù)據(jù)的覆蓋度,在數(shù)據(jù)稀疏的陌生地域,算法泛化能力面臨嚴(yán)峻考驗(yàn)。

3.2 國內(nèi)車企:激光雷達(dá)+視覺的融合派

與特斯拉的"極簡主義"形成鮮明對比,國內(nèi)主流車企(華為、小鵬、蔚來、理想等)普遍采用"激光雷達(dá)+攝像頭+毫米波雷達(dá)"的多傳感器融合方案。這種選擇并非技術(shù)保守,而是基于中國復(fù)雜路況的務(wù)實(shí)考量。

華為ADS是融合方案的典型代表。以問界M9為例,其搭載3顆華為自研192線激光雷達(dá)(后升級為更高線數(shù)產(chǎn)品)、11顆攝像頭、6顆毫米波雷達(dá)與12顆超聲波雷達(dá),構(gòu)建起360度無死角的感知網(wǎng)絡(luò)。華為的核心競爭力在于"全棧自研"——從激光雷達(dá)、毫米波雷達(dá)、攝像頭等傳感器,到MDC計算平臺、鴻蒙座艙、ADS算法,形成完整的垂直整合能力。

小鵬XNGP則代表了"重感知、輕地圖"的技術(shù)路線。通過2顆激光雷達(dá)、11顆攝像頭、5顆毫米波雷達(dá)與12顆超聲波雷達(dá)的組合,小鵬實(shí)現(xiàn)了不依賴高精地圖的城市NOA功能。這種方案降低了對高精地圖的依賴(地圖更新周期通常長達(dá)3個月,而城市道路施工可能3天就變),提升了系統(tǒng)的泛化能力。

比亞迪的技術(shù)路線更為分層:高端車型(如仰望U8)搭載激光雷達(dá)實(shí)現(xiàn)高階智駕,而20萬元以下車型則采用"天神之眼C"純視覺方案(5顆毫米波雷達(dá)+12顆攝像頭+12顆超聲波雷達(dá))。這種"高低搭配"策略,體現(xiàn)了成本敏感市場對純視覺方案的剛性需求。

3.3 國際廠商的分化:從Waymo到Mobileye

在國際市場,技術(shù)路線選擇呈現(xiàn)明顯的場景分化:

Robotaxi運(yùn)營商(Waymo、Cruise、百度Apollo)普遍采用"極致冗余"的多傳感器方案。Waymo的第五代系統(tǒng)搭載5顆激光雷達(dá)、29顆攝像頭、6顆毫米波雷達(dá),甚至包括音頻檢測系統(tǒng),以確保在完全無人駕駛場景下的絕對安全。對于這些運(yùn)營商而言,硬件成本可被服務(wù)收入攤薄,而安全事故的代價則是毀滅性的。

傳統(tǒng)車企(奔馳、寶馬、奧迪)則采取漸進(jìn)式策略。奔馳Drive Pilot(L3級)采用激光雷達(dá)+攝像頭+毫米波雷達(dá)的融合方案,但僅在高速公路等限定場景啟用;寶馬、奧迪的高階智駕系統(tǒng)同樣依賴激光雷達(dá),但功能釋放更為保守。

Mobileye作為視覺算法起家的供應(yīng)商,正逐步向融合方案轉(zhuǎn)型。其EyeQ6芯片平臺支持接入激光雷達(dá),SuperVision系統(tǒng)已開始部署多傳感器融合方案,顯示出純視覺路線在高端市場的局限性。

轉(zhuǎn)下文:當(dāng)激光雷達(dá)成為智能駕駛"標(biāo)配",純視覺將何去何從?>>

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。