3月11日,美國底特律市,特斯拉Model Y又雙叒叕撞上白色大貨車,車頂被削,現(xiàn)場十分慘烈。
看國內(nèi),近一個月,有記者采訪全國各地近20位經(jīng)歷嚴重車禍的特斯拉車主,發(fā)現(xiàn)事故大多相似:突然加速,剎車失靈,車主重傷,不撞上強大障礙物不停車,更有的狂奔8公里之遙。特斯拉的回應(yīng)不想也知:駕駛員一直踩加速踏板,并未剎車。這么先進的車,“黑匣子”數(shù)據(jù)一公開不就結(jié)了?要么在那里扯皮,要么數(shù)據(jù)消失。一次兩次也就算了,卻是一而再再而三。
這些應(yīng)該是“3.15”是事,我們管不了。倒是前不久一則“特斯拉5nm自動駕駛(AV)芯片將與三星合作開發(fā)”的消息讓人發(fā)問:不要說自動駕駛,現(xiàn)在用14nm“正常”行駛都這樣了!5nm難道就是救命稻草?不是挑戰(zhàn)更大嗎?
看看半導體行業(yè)一些頭部公司高管對芯片和封裝、系統(tǒng)和數(shù)據(jù)、可靠與安全、ADAS和自動駕駛,特別是現(xiàn)場驗證的討論,或許可以幫助我們悟出點什么。
5nm是一個未知的世界
國內(nèi)關(guān)于特斯拉與三星的報道似乎有誤:“為其自動駕駛汽車的車載信息娛樂(IVI)或媒體控制單元(MCU)開發(fā)一種5nm半導體?!?/p>
業(yè)界正在試圖開發(fā)5nm汽車AI芯片,工藝變化、電遷移、電磁干擾、電力傳輸問題和檢測的挑戰(zhàn)比比皆是。我們過去從來沒有把一個先進節(jié)點芯片放到汽車這樣極端的環(huán)境中,是否真的了解前方“路況”以及如何應(yīng)對呢?
PDF Solutions先進解決方案副總裁Dennis Ciplickas說:“5nm芯片是一個全新的世界,我們從未去過。獲取、吸收和連接所有數(shù)據(jù)都面臨著挑戰(zhàn)。先進技術(shù)的關(guān)鍵實際上是要了解丟失了哪些數(shù)據(jù)。例如,5nm的中間工序(MOL)有三維的電相互作用,你根本看不到物理檢測。這是我們一直追求內(nèi)聯(lián)‘檢測設(shè)計’的一個主要原因,為的是獲得泄漏的敏感測量值,進而發(fā)現(xiàn)有可能轉(zhuǎn)化為實際缺陷的潛在缺陷。要正確響應(yīng),首先必須知道缺陷的存在,這意味著必須創(chuàng)建新的數(shù)據(jù)。僅僅將數(shù)據(jù)作為制造過程的工件來表示是不夠的,需要區(qū)分數(shù)據(jù)。”
對汽車應(yīng)用來說,先進封裝也是新的東西。雖然多芯片模塊已經(jīng)存在了幾十年,但其封裝并不像我們看到的傳感器融合或一些7/5nm芯片那樣。封裝對可靠性也有影響,這是必須處理的另一層復雜性。
yieldHUB業(yè)務(wù)開發(fā)經(jīng)理Andre van de Geijn認為:“這取決于芯片用在汽車的哪個部分。如果用在娛樂系統(tǒng),可以使用與數(shù)百萬部手機相同的組件,你可以信任這些組件。如果你的手機故障率很高,可以換一個。許多公司說,這只是一個組件,我可以取出模塊,放入一個新的模塊來替換。這與汽車管理系統(tǒng)中的封裝完全不同。制造座椅前后移動按鈕的公司會開發(fā)出全新的技術(shù),在這些按鈕失效時可以更換。但如果是汽車管理單元,那就完全不同了?!?/p>
proteanTecs汽車部門總經(jīng)理Gal Carmel說:“先進封裝增加了另一層復雜性,因為它缺乏可見性,并且依賴于高密度架構(gòu),從而限制了冗余退路(fallback),而汽車系統(tǒng)需要冗余。此外,芯片的人工智能(AI)部分正在增長。它不僅涉及到封裝和先進節(jié)點,而且芯片架構(gòu)是AI驅(qū)動的,并使用現(xiàn)場推理和訓練來不斷改進硬件架構(gòu)。使用這個反饋回路,就可以減少硬件冗余并優(yōu)化復雜性?!?/p>
OptimalPlus汽車業(yè)務(wù)部門副總裁兼總經(jīng)理Uzi Baruch表示:“封裝確實增加了層次結(jié)構(gòu)和組裝組件的復雜性,需要在三個維度相互關(guān)聯(lián)。這本身就引入了數(shù)據(jù)的語義概念。它有多個向量,其中一個也是層次元素。它確實增加了復雜性,因為一個組件不能看作一個單獨的單元,必須考慮組件的層次結(jié)構(gòu)。如果你不這么做,你從分析中得到的東西就會非常有限。然而,如果你做的對,就可以精確定位問題所在?!?/p>
Ciplickas說:“由于組件間的相互作用,封裝中的系統(tǒng)或3D集成將帶來新的失效模式。芯片到芯片的通信不同于芯片到板的通信,并且電熱/機械交互作用也不同。一家汽車制造商說過,在應(yīng)力下,SRAM的失效方式是可預測的,但他們實際上是在儀器上測量的。這導致了如何在ECU外殼中構(gòu)建掛載點(mount point)的PCB設(shè)計規(guī)則。挑戰(zhàn)在于,將3D或2.5D集成封裝放入惡劣環(huán)境后果會怎樣。所以不僅僅是芯片間的通信。這些封裝的熱分布和你想象的不同,會改變其膨脹和應(yīng)力,然后會改變性能,因為我們知道應(yīng)力會改變器件的行為。了解單個芯片在晶圓分類測試中的行為,然后了解封裝中的內(nèi)容——進行封裝級評估,并將所有這些放在一起——是一個巨大的挑戰(zhàn)。在汽車中使用先進的2.5D集成是一個全新的嘗試,尤其是在安全關(guān)鍵的系統(tǒng)中。”
軟件可能會產(chǎn)生意想不到的后果
現(xiàn)在,整個行業(yè)都在探討軟件定義汽車,先進一點的汽車(如特斯拉)都用軟件來控制某些功能,還有OTA(空中下載技術(shù))。如果你更新了一個復雜軟件系統(tǒng)的一部分,就有可能影響到這個系統(tǒng)中的所有東西。如果你添加了大量軟件,在硬件不支持的情況下,車輛性能就會下降,甚至會影響到路上的其他車輛。
Ciplickas說:“軟件很有挑戰(zhàn)性,因為它不遵循任何物理規(guī)則。硬件聽起來很難,但它實際上遵循一些邊界條件。有了軟件,你可以改變一切,這可能會產(chǎn)生很多意想不到的后果?!笔鞘裁春蠊??
Carmel認為:“利用深度數(shù)據(jù),我們可以將硬件虛擬化,更好地感知軟件操作的影響。通過這些虛擬化,你可以轉(zhuǎn)向一種自適應(yīng)軟件模型,該模型針對車輛的ECU性能和現(xiàn)場退化進行定制。人工智能(AI)應(yīng)用增加了芯片上AI的比例,以滿足軟件的需求。這將有助于減少冗余并確保優(yōu)化功能。此外,實地推斷和訓練將不斷改進硬件和軟件之間的相互作用。”車輛中各系統(tǒng),特別是傳感器、雷達等的冗余對于安全至關(guān)重要,怎么優(yōu)化的確是個逆坂走丸的事情。
最大挑戰(zhàn)是安全性
在設(shè)計方面,可靠性和安全性密不可分。最大的挑戰(zhàn)是如何在這些系統(tǒng)中建立安全機制?
Ciplickas認為:“安全性有很多方面,但一些用于優(yōu)化可靠性的技術(shù)和測試可以提供提升安全性的工具。例如,調(diào)試監(jiān)視器或漂移和移位監(jiān)視器可以檢測某些類型的攻擊,無論是在t = 0時檢測到的,還是在現(xiàn)場檢測到的異常行為或漂移。這些監(jiān)視器已經(jīng)被用于系統(tǒng)運行和優(yōu)化,兩者之間有相關(guān)的基礎(chǔ)設(shè)施,盡管它們的應(yīng)用方式非常不同?!?/p>
Carmel說:“這是一個使用數(shù)據(jù)的機會,因為你提供的數(shù)據(jù)越有價值,芯片的簽名就越好。最終,這些數(shù)據(jù)會幫助你理解是否有異常。這對關(guān)閉有問題的車輛可能更為緊迫。使用深度數(shù)據(jù),你可以創(chuàng)建24/7車隊可見性,并在問題發(fā)生時立即確定問題?!?/p>
現(xiàn)在,汽車系統(tǒng)中移動的數(shù)據(jù)量非常巨大,是否真的能夠檢測到一個非常輕微的異常呢?
Carmel接著說:“基于通用芯片遙測的深層數(shù)據(jù)有助于深入了解實際芯片和系統(tǒng)的操作、性能、可靠性裕度和性能退化。這種真實世界的數(shù)據(jù)并不依賴于觸點的轉(zhuǎn)移,而是依賴于實地操作的輸出?!?/p>
Ciplickas介紹說:“關(guān)于信號和噪聲,業(yè)界已開發(fā)出可以找到信號的技術(shù)。如果在加工晶圓或引線鍵合時觀察設(shè)備上的傳感器數(shù)據(jù),就能得到的各種各樣的信號。在這些信號中發(fā)現(xiàn)的異常有時是微小的光點。利用機器學習技術(shù),在原本‘好’的噪聲海洋中可以找到那些微小的斑點。與其把它看作是一種制造晶圓的設(shè)備,不如把它看作是一個在現(xiàn)場運行的系統(tǒng),了解這些微小的光點是有可能的?!?/p>
KLA戰(zhàn)略合作先進總監(jiān)Jay Rathert認為:“最大的挑戰(zhàn)不是看到缺陷本身,而是理解哪些缺陷是相關(guān)的,哪些可能成為潛在缺陷。將設(shè)計和改進測試聯(lián)系起來才價值。兩者結(jié)合越緊密,并擁有一個迭代或協(xié)作、對齊的數(shù)據(jù)集,就越能更好地理解芯片上需要發(fā)生什么樣的輸入和輸出。我們需要架起設(shè)計與測試的橋梁,消除產(chǎn)品生命周期中存在的各種問題。”
使用上游數(shù)據(jù)理解下游信號是一種非常強大的技術(shù),它有助于預測潛在的問題。
Baruch說:“人們往往傾向于研究預測模型,但是他們忽略了這樣一個事實:功能集——實際上對預測事物的能力有很大貢獻。它可以過濾噪聲、發(fā)現(xiàn)什么重要什么不重要,以及任何問題的根本原因是什么。我們經(jīng)常使用左移(shift-left)模式(把位于傳統(tǒng)軟件開發(fā)流程中最后階段的測試往前提)。為避免大海撈針,好的模型可以幫助你發(fā)現(xiàn)什么是優(yōu)先權(quán)問題,只要你決定從哪個角度來看即可。建立了這些模型,你就會預測一些東西,你也需要一些人來修復那些模型中錯誤的屬性。”
遠未到制造全自動駕駛汽車的時候
ADAS和自動駕駛似乎并不是一回事。進入完全自動駕駛,必須開始思考系統(tǒng)之系統(tǒng)(SoS)的協(xié)作。如果汽車使用不同代的芯片和軟件,會發(fā)生什么呢?
Carmel說:“從ADAS到AV的基本意義是了解它們經(jīng)歷了什么樣的失敗。最終,需要定義性能范圍。每輛車都有自己的性能范圍,因為它有不同的硬件,不同的軟件,不同的級別。當你確切地知道如何定義這個性能范圍,并在可靠性和安全性之間建立平衡時,你就可以控制車隊了。使用深層數(shù)據(jù),我們可以定義每個模型和每個單元的獨立功能,并勾勒出一個自動駕駛層次結(jié)構(gòu)?!?/p>