美東時間10月8日周二在華盛頓舉行的“英偉達AI峰會”期間,英偉達強調(diào)了同臺積電在加速計算領(lǐng)域合作的成績:英偉達名為cuLitho 的計算光刻平臺正在臺積電投入生產(chǎn),加速計算進一步大幅提升了計算光刻這一芯片制造基石步驟的速度,并降低能耗。
英偉達稱,cuLitho 將加速計算引入計算光刻領(lǐng)域。將 cuLitho 投入生產(chǎn)使臺積電能夠加快下一代芯片技術(shù)的開發(fā),而目前的生產(chǎn)流程正接近物理學的極限。臺積電應用cuLitho進行生產(chǎn)可以提高制造下一代先進半導體芯片的速度,并突破物理限制。
計算光刻是電腦芯片制造的關(guān)鍵步驟。ASML對它的定義是,利用計算機建模、仿真和數(shù)據(jù)分析等手段,預測、校正、優(yōu)化和驗證光刻工藝在一系列圖案、工藝和系統(tǒng)條件下的成像性能。它涉及電磁物理、光化學、計算幾何、迭代優(yōu)化和分布式計算這些復雜的計算,是整個半導體設計和制造過程中計算最密集的工作負載。晶圓代工廠通常會專門為這些計算設立大型數(shù)據(jù)中心。而現(xiàn)在先進芯片的尺寸越來越小,降至3nm及以下,需要計算光刻更加精準,計算光刻所需的時間也越來越多。沒有更強大的計算光刻很難實現(xiàn)復雜的掩模版設計。計算光刻歷來是將新技術(shù)節(jié)點和電腦架構(gòu)推向市場的瓶頸。
去年的英偉達開發(fā)者大會GTC上,英偉達發(fā)布了基于GPU構(gòu)建的cuLitho計算光刻技術(shù)軟件庫,被稱為改變計算光刻領(lǐng)域游戲規(guī)則的軟件。cuLitho的核心是英偉達科學家發(fā)明的一組并行算法,計算光刻工藝的所有部分都可以并行運行。原來需要4萬個CPU系統(tǒng)才能完成的工作,現(xiàn)在僅需用500個英偉達DGX H100系統(tǒng)即可完成。使用cuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3-5倍,而耗電量可以比當前配置降低9倍。
本周二英偉達重申了今年GTC大會上披露的成績,每年,先進的代工廠要為計算光刻耗費數(shù)百億小時CPU計算時間,一個芯片掩模組通??赡苄枰?3000 萬小時或更多的 CPU 計算時間,因此代工廠必須有大型數(shù)據(jù)中心。而通過加速計算,350 套英偉達H100 Tensor Core GPU 的系統(tǒng)現(xiàn)在就可以取代 4萬套CPU 系統(tǒng),加快了生產(chǎn)時速度,同時降低了成本、空間要求和功耗。
臺積電CEO魏哲家在今年的英偉達GTC大會上表示,通過與英偉達一同將 GPU 加速計算整合到臺積電的工作流中臺積電大幅提升了性能、增加了吞吐量、縮短了周期時間,并減少了功耗。
英偉達今年的GTC大會披露,自去年推出以來,cuLitho 為臺積電的創(chuàng)新圖案化技術(shù)帶來了新的機遇。在共享工作流上進行的 cuLitho 測試顯示,英偉達和臺積電共同將曲線流程速度和傳統(tǒng)曼哈頓式流程速度分別提升了 45 倍和近 60 倍。這兩種流程的不同點在于曲線流程的光掩模形狀為曲線,曼哈頓式流程的光掩模形狀被限制為水平或垂直。
本周二英偉達還提到其開發(fā)的生成式 AI 應用算法。事實證明,這種算法提升了cuLitho 平臺的價值。在 cuLitho 加快流程速度的基礎(chǔ)上,新的生成式 AI 工作流將速度又提升了兩倍。應用生成式 AI 可以創(chuàng)建近乎完美的反向光掩?;蚍聪蚪鉀Q方案,解決計算光刻中光的衍射問題,然后再通過傳統(tǒng)的嚴格物理方法推導出最終的光掩模,從而將整個光學鄰近效應校正 (OPC) 流程加快兩倍。
OPC在半導體光刻中的應用已有三十年歷史。英偉達稱,三十年來,很少有像加速計算和AI這兩種技術(shù)這樣,為OPC帶來如此迅速的轉(zhuǎn)變。這些技術(shù)讓物理模擬更精確,并且實現(xiàn)了曾經(jīng)資源密集型的數(shù)學技術(shù)。
目前晶圓廠工藝的許多變化都需要對 OPC 進行修改,這增加了計算量,并給晶圓廠的開發(fā)周期帶來瓶頸。計算光刻技術(shù)的速度大幅提升加快了晶圓廠創(chuàng)建每個掩膜的速度,從而縮短了開發(fā)新技術(shù)節(jié)點的總周期。更重要的是,它讓過去無法實現(xiàn)的新計算成為可能。
英偉達舉例稱,二十年前科學文獻就提出了逆向光刻技術(shù),但由于計算時間過長,因此在很大程度上無法在全芯片規(guī)模上實現(xiàn)準確計算。有了 cuLitho,情況就不再如此。領(lǐng)先的代工廠將用它來提升逆向和曲線解決方案,這將有助于創(chuàng)造下一代強大的半導體。