編者按:智能駕駛領(lǐng)域的激光雷達(dá)與純視覺(jué)之爭(zhēng),本質(zhì)上確實(shí)是"硬件傳感器冗余"與"AI算力替代"兩種技術(shù)哲學(xué)的較量。"更聰明的眼睛"和"更強(qiáng)大的大腦"的博弈在2025年已進(jìn)入白熱化階段,2026年智能感知技術(shù)會(huì)倒向哪邊?融合還是更加分裂?
續(xù)上文:激光雷達(dá)進(jìn)階到圖像級(jí),智能駕駛方案之爭(zhēng)要結(jié)束了?>>
第四章:汽車(chē)與具身智能的方案適配——場(chǎng)景決定技術(shù)
4.1 乘用車(chē)市場(chǎng):分層融合成為主流
在乘用車(chē)領(lǐng)域,技術(shù)路線(xiàn)正呈現(xiàn)"分層融合"的演進(jìn)趨勢(shì):
L2級(jí)輔助駕駛(高速NOA、自動(dòng)泊車(chē)):純視覺(jué)方案已具備足夠競(jìng)爭(zhēng)力。比亞迪天神之眼C、特斯拉Autopilot等系統(tǒng)證明,在結(jié)構(gòu)化道路與良好光照條件下,攝像頭+毫米波雷達(dá)的組合已能滿(mǎn)足基本需求。這一市場(chǎng)的核心訴求是成本可控,激光雷達(dá)的性?xún)r(jià)比優(yōu)勢(shì)尚不明顯。
L2+級(jí)城市智駕(城市NOA、無(wú)圖方案):激光雷達(dá)的價(jià)值開(kāi)始凸顯。中國(guó)城市道路的復(fù)雜性(非機(jī)動(dòng)車(chē)混行、施工路段、異形障礙物)遠(yuǎn)超高速公路,激光雷達(dá)的三維感知能力可有效降低事故風(fēng)險(xiǎn)。華為ADS、小鵬XNGP等系統(tǒng)的成功,驗(yàn)證了融合方案在城市場(chǎng)景的必要性。
L3級(jí)有條件自動(dòng)駕駛:法規(guī)要求與 Liability(責(zé)任歸屬)推動(dòng)激光雷達(dá)成為標(biāo)配。在駕駛員可脫手但仍需隨時(shí)接管的場(chǎng)景下,系統(tǒng)必須具備高度的環(huán)境感知可靠性,激光雷達(dá)的物理測(cè)量能力成為安全認(rèn)證的關(guān)鍵支撐。
L4級(jí)Robotaxi:多傳感器冗余是硬性要求。Waymo、百度Apollo等運(yùn)營(yíng)商的方案表明,在完全無(wú)人駕駛場(chǎng)景下,激光雷達(dá)、攝像頭、毫米波雷達(dá)、超聲波雷達(dá)甚至音頻傳感器的組合,是滿(mǎn)足"失效可運(yùn)營(yíng)"安全標(biāo)準(zhǔn)的必要條件。
4.2 具身智能:激光雷達(dá)的藍(lán)海市場(chǎng)
當(dāng)自動(dòng)駕駛的爭(zhēng)論尚未平息,具身智能(Embodied AI)的浪潮又為激光雷達(dá)開(kāi)辟了新的戰(zhàn)場(chǎng)。2025年,禾賽科技與廣和通聯(lián)合發(fā)布的機(jī)器人激光雷達(dá)方案,已成功落地國(guó)內(nèi)頭部具身智能公司的最新產(chǎn)品,標(biāo)志著激光雷達(dá)從"車(chē)載傳感器"向"通用三維感知設(shè)備"的躍遷。
具身智能的感知需求與自動(dòng)駕駛既有共性又有差異:
共性在于都需要三維環(huán)境建模、障礙物檢測(cè)與避障、高精度定位與導(dǎo)航。無(wú)論是輪式機(jī)器人、四足機(jī)器狗還是人形機(jī)器人,在復(fù)雜環(huán)境中移動(dòng)時(shí),都必須實(shí)時(shí)感知周?chē)匦巍⒄系K物與動(dòng)態(tài)物體。
差異在于應(yīng)用場(chǎng)景的極端多樣性。自動(dòng)駕駛主要面向結(jié)構(gòu)化道路,而具身智能的應(yīng)用涵蓋商業(yè)服務(wù)、勘測(cè)巡檢、物流遞送、搶險(xiǎn)救災(zāi)、家庭服務(wù)等多維場(chǎng)景。這些場(chǎng)景對(duì)傳感器的要求更為苛刻:室內(nèi)環(huán)境光照變化劇烈,室外環(huán)境可能遭遇暴雨、沙塵,狹窄空間要求傳感器體積小巧,長(zhǎng)續(xù)航要求低功耗設(shè)計(jì)。
激光雷達(dá)在具身智能中的獨(dú)特價(jià)值體現(xiàn)在:
厘米級(jí)定位精度是室內(nèi)導(dǎo)航的基礎(chǔ)。在GPS信號(hào)缺失的室內(nèi)環(huán)境,激光雷達(dá)SLAM(同步定位與地圖構(gòu)建)技術(shù)可實(shí)現(xiàn)厘米級(jí)定位,這是視覺(jué)SLAM在紋理缺失環(huán)境(如長(zhǎng)走廊、白墻)中難以企及的。
360°全向感知提升安全性。禾賽JT系列激光雷達(dá)的360°×189°超半球視野,可覆蓋機(jī)器人周?chē)娜蚩臻g,避免視覺(jué)方案因視野盲區(qū)導(dǎo)致的碰撞風(fēng)險(xiǎn)。
多模態(tài)融合優(yōu)勢(shì)支撐復(fù)雜交互。具身智能不僅需要"看見(jiàn)"環(huán)境,還需要理解環(huán)境中的語(yǔ)義信息(如門(mén)把手、按鈕、工具)。激光雷達(dá)提供的三維幾何信息與攝像頭的語(yǔ)義信息融合,可實(shí)現(xiàn)更精準(zhǔn)的物體抓取與操作。
純視覺(jué)方案在具身智能中的局限更為突出。室內(nèi)環(huán)境的低光照、高動(dòng)態(tài)范圍、缺乏紋理等特性,對(duì)視覺(jué)算法構(gòu)成嚴(yán)峻挑戰(zhàn);而機(jī)器人與環(huán)境的物理交互(如抓取、搬運(yùn))對(duì)深度精度要求極高,純視覺(jué)的深度估計(jì)誤差可能導(dǎo)致操作失敗甚至安全事故。
4.3 技術(shù)路線(xiàn)的場(chǎng)景適配原則
綜合汽車(chē)與具身智能的應(yīng)用場(chǎng)景,可以提煉出技術(shù)路線(xiàn)選擇的基本原則:
成本敏感型場(chǎng)景(大眾市場(chǎng)乘用車(chē)、消費(fèi)級(jí)機(jī)器人):優(yōu)先采用純視覺(jué)方案,通過(guò)算法優(yōu)化彌補(bǔ)硬件局限,實(shí)現(xiàn)功能與成本的平衡。
安全關(guān)鍵型場(chǎng)景(L4自動(dòng)駕駛、工業(yè)機(jī)器人、搶險(xiǎn)救災(zāi)):必須采用激光雷達(dá)為核心的多傳感器融合方案,通過(guò)硬件冗余確保極端場(chǎng)景下的可靠性。
精度要求型場(chǎng)景(高精度地圖構(gòu)建、室內(nèi)導(dǎo)航、精密操作):激光雷達(dá)的物理測(cè)量精度不可替代,純視覺(jué)方案難以滿(mǎn)足厘米級(jí)甚至毫米級(jí)的精度需求。
數(shù)據(jù)豐富型場(chǎng)景(結(jié)構(gòu)化道路、標(biāo)準(zhǔn)室內(nèi)環(huán)境):純視覺(jué)方案可通過(guò)海量數(shù)據(jù)訓(xùn)練達(dá)到接近激光雷達(dá)的性能,且具備更高的語(yǔ)義理解能力。
第五章:L4級(jí)自動(dòng)駕駛的方案選擇——安全底線(xiàn)與技術(shù)演進(jìn)
5.1 L4級(jí)的安全哲學(xué):從"輔助"到"負(fù)責(zé)"
L4級(jí)自動(dòng)駕駛代表著技術(shù)躍遷的臨界點(diǎn)——從"駕駛員負(fù)責(zé)"的輔助駕駛,轉(zhuǎn)向"系統(tǒng)負(fù)責(zé)"的完全無(wú)人駕駛。這一轉(zhuǎn)變對(duì)感知系統(tǒng)提出了"零事故"的嚴(yán)苛要求,任何單點(diǎn)故障都可能導(dǎo)致災(zāi)難性后果。
"失效可運(yùn)營(yíng)"(Fail-operational)是L4系統(tǒng)的核心設(shè)計(jì)準(zhǔn)則。這意味著,當(dāng)任何一個(gè)傳感器、計(jì)算單元或執(zhí)行機(jī)構(gòu)發(fā)生故障時(shí),系統(tǒng)仍能將車(chē)輛安全停靠至最小風(fēng)險(xiǎn)狀態(tài),無(wú)需人工干預(yù)。這一準(zhǔn)則從根本上排除了單一傳感器方案的可行性——無(wú)論是純視覺(jué)還是純激光雷達(dá),都無(wú)法在自身失效時(shí)提供冗余保障。
"最小風(fēng)險(xiǎn)操作"(Minimal Risk Maneuver)要求系統(tǒng)在感知不確定性增加時(shí),主動(dòng)采取保守策略。例如,當(dāng)激光雷達(dá)被暴雨干擾、攝像頭被強(qiáng)光致盲時(shí),系統(tǒng)必須能夠識(shí)別感知降質(zhì),并觸發(fā)減速、靠邊停車(chē)等安全措施。這種"自知之明"的能力,需要多傳感器交叉驗(yàn)證才能實(shí)現(xiàn)。
5.2 當(dāng)前技術(shù)現(xiàn)實(shí):多傳感器融合是唯一路徑
基于上述安全準(zhǔn)則,當(dāng)前L4級(jí)自動(dòng)駕駛的技術(shù)現(xiàn)實(shí)是:純視覺(jué)方案尚不足以獨(dú)立支撐L4級(jí)應(yīng)用,激光雷達(dá)與視覺(jué)的融合是主流選擇。
這一判斷基于以下技術(shù)事實(shí):
長(zhǎng)尾場(chǎng)景的不可預(yù)測(cè)性:L4系統(tǒng)必須應(yīng)對(duì)概率極低但后果嚴(yán)重的異常場(chǎng)景(如高速公路上掉落的輪胎、施工區(qū)的異形路障、夜間穿行的野生動(dòng)物)。純視覺(jué)方案依賴(lài)訓(xùn)練數(shù)據(jù)的覆蓋度,對(duì)于未見(jiàn)過(guò)的情況可能產(chǎn)生"幻覺(jué)"(如將陰影誤判為障礙物,或?qū)⒄鎸?shí)障礙物忽略)。激光雷達(dá)的三維點(diǎn)云可提供幾何層面的驗(yàn)證,有效降低此類(lèi)風(fēng)險(xiǎn)。
極端環(huán)境的物理極限:在夜間無(wú)路燈、強(qiáng)逆光、暴雨、沙塵等場(chǎng)景下,攝像頭的物理性能存在不可逾越的局限。雖然算法可通過(guò)HDR、去霧等技術(shù)緩解問(wèn)題,但信噪比的物理下降會(huì)導(dǎo)致感知精度不可逆的衰減。激光雷達(dá)的主動(dòng)發(fā)光特性,使其在這些場(chǎng)景下仍能保持穩(wěn)定性能。
系統(tǒng)可解釋性與認(rèn)證需求:L4級(jí)自動(dòng)駕駛需要通過(guò)嚴(yán)格的安全認(rèn)證(如ISO 26262功能安全、ISO 21448預(yù)期功能安全)。純視覺(jué)的端到端模型雖性能強(qiáng)大,但"黑盒"特性導(dǎo)致其決策過(guò)程難以解釋與驗(yàn)證,給認(rèn)證帶來(lái)巨大挑戰(zhàn)。多傳感器融合的分層架構(gòu),具備更高的模塊獨(dú)立性與故障可追溯性,更易滿(mǎn)足認(rèn)證要求。
算力與成本的平衡:雖然激光雷達(dá)增加了硬件成本,但其提供的精確三維信息可降低后端算法的復(fù)雜度與算力需求。純視覺(jué)方案雖硬件便宜,但需要極高的算力(特斯拉FSD芯片144TOPS)與海量數(shù)據(jù)訓(xùn)練(48億公里路測(cè)數(shù)據(jù)),綜合成本未必更低。
5.3 未來(lái)演進(jìn):純視覺(jué)的潛在突破與激光雷達(dá)的持續(xù)進(jìn)化
盡管當(dāng)前L4級(jí)系統(tǒng)普遍采用多傳感器融合,但技術(shù)的演進(jìn)正在模糊路線(xiàn)界限:
純視覺(jué)方案的潛在突破依賴(lài)于三個(gè)方向:一是世界模型(World Model)的成熟,通過(guò)生成式AI構(gòu)建環(huán)境的動(dòng)態(tài)三維表征,彌補(bǔ)二維圖像的信息損失;二是神經(jīng)輻射場(chǎng)(NeRF)等三維重建技術(shù)的應(yīng)用,從多視角圖像中恢復(fù)精確的幾何結(jié)構(gòu);三是超大規(guī)模數(shù)據(jù)訓(xùn)練,通過(guò)數(shù)十億公里的路測(cè)數(shù)據(jù)覆蓋所有可能場(chǎng)景,將"長(zhǎng)尾"壓縮至可接受水平。
然而,這些突破面臨根本性挑戰(zhàn):世界模型與NeRF的計(jì)算開(kāi)銷(xiāo)巨大,難以滿(mǎn)足實(shí)時(shí)性要求;而"覆蓋所有場(chǎng)景"的數(shù)據(jù)需求在數(shù)學(xué)上近乎無(wú)窮,且無(wú)法保證對(duì)未知場(chǎng)景的泛化能力。因此,在可預(yù)見(jiàn)的未來(lái)(3-5年),純視覺(jué)方案獨(dú)立支撐L4級(jí)應(yīng)用的可能性較低。
激光雷達(dá)的持續(xù)進(jìn)化則呈現(xiàn)以下趨勢(shì):一是固態(tài)化與芯片化,通過(guò)光學(xué)相控陣(OPA)、微機(jī)電系統(tǒng)(MEMS)或閃光(Flash)技術(shù)取代機(jī)械旋轉(zhuǎn)結(jié)構(gòu),提升可靠性并降低成本;二是高線(xiàn)數(shù)與圖像化,512線(xiàn)、1000線(xiàn)產(chǎn)品逐步普及,點(diǎn)云密度逼近攝像頭圖像,可直接用于端到端學(xué)習(xí);三是4D成像與多回波,增加速度維信息與穿透植被、雨霧的能力;四是智能激光雷達(dá),在傳感器端集成AI處理芯片,輸出語(yǔ)義級(jí)點(diǎn)云而非原始數(shù)據(jù),降低后端算力壓力。
這些演進(jìn)意味著,激光雷達(dá)正在從"獨(dú)立的測(cè)距傳感器"進(jìn)化為"高精度的三維視覺(jué)系統(tǒng)",其與攝像頭的界限日益模糊。未來(lái)的L4級(jí)系統(tǒng),可能不再區(qū)分"激光雷達(dá)方案"與"純視覺(jué)方案",而是采用"多模態(tài)深度學(xué)習(xí)"架構(gòu),將激光雷達(dá)點(diǎn)云、攝像頭圖像、毫米波雷達(dá)回波統(tǒng)一編碼為 tokens,輸入 Transformer 模型進(jìn)行聯(lián)合推理。
第六章:結(jié)論與展望——技術(shù)融合的大勢(shì)所趨
6.1 核心結(jié)論:圖像級(jí)激光雷達(dá)重塑競(jìng)爭(zhēng)格局
回顧全文,我們可以得出以下核心結(jié)論:
第一,激光雷達(dá)的"圖像級(jí)"進(jìn)化正在消解純視覺(jué)方案的技術(shù)優(yōu)勢(shì)。 當(dāng)禾賽、速騰聚創(chuàng)等廠商推出512線(xiàn)以上、點(diǎn)云密度逼近圖像的固態(tài)激光雷達(dá)時(shí),純視覺(jué)方案在語(yǔ)義理解方面的獨(dú)占性?xún)?yōu)勢(shì)被打破。激光雷達(dá)不再僅僅是"測(cè)距工具",而是成為了具備三維感知能力的"超級(jí)攝像頭"。
第二,成本下降使激光雷達(dá)從"奢侈品"變?yōu)?quot;標(biāo)配"。 從2015年的75000美元到如今的500美元以下,激光雷達(dá)的價(jià)格降幅超過(guò)99%。在20萬(wàn)元以上的中高端車(chē)型,激光雷達(dá)已成為智駕系統(tǒng)的標(biāo)準(zhǔn)配置;在10-20萬(wàn)元區(qū)間,隨著成本進(jìn)一步下降,激光雷達(dá)的滲透率將持續(xù)提升。
第三,純視覺(jué)方案的成本優(yōu)勢(shì)在縮小,而算法護(hù)城河面臨挑戰(zhàn)。 特斯拉的純視覺(jué)路線(xiàn)依賴(lài)于自研芯片(144TOPS算力)與48億公里數(shù)據(jù)積累,這種優(yōu)勢(shì)在激光雷達(dá)成本崩塌與開(kāi)源算法普及的背景下難以持續(xù)。國(guó)內(nèi)車(chē)企通過(guò)供應(yīng)鏈整合與算法自研,正在快速縮小差距。
第四,L4級(jí)自動(dòng)駕駛的安全底線(xiàn)決定了多傳感器融合的必要性。 在"失效可運(yùn)營(yíng)"與"零事故"的嚴(yán)苛要求下,任何單一傳感器方案都無(wú)法滿(mǎn)足L4級(jí)的安全認(rèn)證標(biāo)準(zhǔn)。激光雷達(dá)與視覺(jué)的融合,不是"過(guò)渡方案",而是"終極方案"的雛形。
第五,具身智能為激光雷達(dá)開(kāi)辟了增量市場(chǎng)。 在機(jī)器人、無(wú)人機(jī)、工業(yè)自動(dòng)化等領(lǐng)域,激光雷達(dá)的三維感知能力與厘米級(jí)定位精度具有不可替代性,純視覺(jué)方案難以滿(mǎn)足復(fù)雜環(huán)境下的可靠性要求。
6.2 未來(lái)展望:從"路線(xiàn)之爭(zhēng)"到"融合共生"
展望未來(lái),自動(dòng)駕駛感知技術(shù)的發(fā)展將呈現(xiàn)以下趨勢(shì):
技術(shù)融合:激光雷達(dá)與視覺(jué)的界限將日益模糊。圖像級(jí)激光雷達(dá)可輸出帶語(yǔ)義信息的密集點(diǎn)云,視覺(jué)算法可通過(guò)NeRF等技術(shù)重建三維結(jié)構(gòu),兩者的數(shù)據(jù)格式與處理流程將趨同。未來(lái)的感知系統(tǒng),可能是"激光雷達(dá)+攝像頭+毫米波雷達(dá)+超聲波雷達(dá)"的統(tǒng)一神經(jīng)網(wǎng)絡(luò),而非分層融合的模塊化架構(gòu)。
成本下探:固態(tài)激光雷達(dá)、4D成像雷達(dá)、事件相機(jī)等新型傳感器,將在成本與性能之間找到新的平衡點(diǎn)。當(dāng)激光雷達(dá)價(jià)格降至200美元以下,其在中低端車(chē)型的普及將加速,純視覺(jué)方案的生存空間將進(jìn)一步壓縮。
算法進(jìn)化:端到端大模型、世界模型、多模態(tài)Transformer等技術(shù),將提升感知系統(tǒng)的泛化能力與魯棒性。但無(wú)論算法如何進(jìn)化,物理層面的冗余仍是安全的基礎(chǔ)——這是航空、核電等安全關(guān)鍵行業(yè)的普遍規(guī)律,自動(dòng)駕駛亦不例外。
場(chǎng)景分化:不同應(yīng)用場(chǎng)景將采用差異化的傳感器配置。Robotaxi追求極致安全,采用"全傳感器冗余";高端私家車(chē)追求性能與成本的平衡,采用"1-3顆激光雷達(dá)+攝像頭"的融合方案;中低端私家車(chē)與消費(fèi)級(jí)機(jī)器人追求成本極致,采用純視覺(jué)或"輕量級(jí)融合"方案。
結(jié)語(yǔ):當(dāng)激光雷達(dá)成為"標(biāo)配",純視覺(jué)將何去何從?
回到文章的設(shè)問(wèn):當(dāng)激光雷達(dá)進(jìn)階到圖像級(jí),純視覺(jué)方案僅存的優(yōu)勢(shì)也不再——這一判斷并非宣告純視覺(jué)方案的消亡,而是指出其技術(shù)空間的收縮與應(yīng)用場(chǎng)景的分化。
純視覺(jué)方案不會(huì)消失,它將退守至成本極度敏感的市場(chǎng)(如10萬(wàn)元以下車(chē)型、消費(fèi)級(jí)機(jī)器人、農(nóng)業(yè)無(wú)人機(jī)等),依靠算法優(yōu)化與數(shù)據(jù)積累維持競(jìng)爭(zhēng)力。但在主流乘用車(chē)市場(chǎng),尤其是20萬(wàn)元以上的中高端車(chē)型,激光雷達(dá)將從"差異化配置"演變?yōu)?quot;安全標(biāo)配",如同ABS、ESP、安全氣囊的歷史演進(jìn)。
更具深遠(yuǎn)意義的是,激光雷達(dá)的"圖像級(jí)"進(jìn)化正在推動(dòng)感知技術(shù)的范式轉(zhuǎn)移:從"多傳感器分層融合"走向"多模態(tài)統(tǒng)一表征",從"幾何測(cè)量+語(yǔ)義理解"的分工走向"三維語(yǔ)義一體化"的感知。在這一范式下,"激光雷達(dá) vs. 純視覺(jué)"的二元對(duì)立將失去意義,取而代之的是"高精度三維感知"的統(tǒng)一技術(shù)架構(gòu)。
對(duì)于特斯拉而言,其純視覺(jué)路線(xiàn)面臨艱難抉擇:是堅(jiān)持信仰、在算法極限上繼續(xù)突破,還是向現(xiàn)實(shí)妥協(xié)、引入激光雷達(dá)作為安全冗余?2025年FSD入華后的表現(xiàn),以及Cybercab的量產(chǎn)進(jìn)度,將是觀察這一抉擇的關(guān)鍵窗口。
對(duì)于中國(guó)車(chē)企而言,激光雷達(dá)的國(guó)產(chǎn)替代與成本下降是難得的戰(zhàn)略機(jī)遇。通過(guò)垂直整合(自研激光雷達(dá)、芯片、算法)與規(guī)模效應(yīng),中國(guó)有望在智能駕駛感知領(lǐng)域建立全球領(lǐng)先地位,如同在動(dòng)力電池領(lǐng)域的成功。
技術(shù)路線(xiàn)的紛爭(zhēng)終將落幕,但技術(shù)進(jìn)化的腳步永不停歇。當(dāng)激光雷達(dá)成為"圖像級(jí)"的三維之眼,自動(dòng)駕駛的感知系統(tǒng)將更加接近人類(lèi)駕駛員的感知能力——甚至超越之。這不僅是技術(shù)的勝利,更是安全的福音。畢竟,在生命的重量面前,任何技術(shù)路線(xiàn)的傲慢都顯得微不足道。唯有融合、進(jìn)化、回歸本質(zhì),方能駛向智能駕駛的終極未來(lái)。

