《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 斷供高端GPU不實!對英偉達傷害性不大,侮辱性極強?

斷供高端GPU不實!對英偉達傷害性不大,侮辱性極強?

2022-09-02
作者: 張慧娟
來源:與非網(wǎng)eefocus
關鍵詞: 英偉達 GPU 斷供

  根據(jù)英偉達給美國證監(jiān)會SEC(Securities and Exchange Commission)的申報備案,“對中國區(qū)客戶斷供高端GPU芯片”的消息并不完全準確。

  根據(jù)申報內容,2022年8月26日,美國政府通知英偉達未來向中國(包括香港)和俄羅斯出口的A100和即將推出的H100集成電路實施了新的許可要求,且立即生效。原文表達如下:

  On August 26, 2022, the U.S. government, or USG, informed NVIDIA Corporation, or the Company, that the USG has imposed a new license requirement, effective immediately, for any future export to China (including Hong Kong) and Russia of the Company’s A100 and forthcoming H100 integrated circuits.

  值得斟酌的是這里的措辭,是“實施新的許可要求”,這與“斷供”有著本質的區(qū)別?!皵喙庇胁蝗葜靡傻膹娭菩?,但“許可要求”則是指英偉達在中國市場提供上述產(chǎn)品需要征得許可,也就是說,經(jīng)由美國政府評估后,仍存有一定繼續(xù)出售的可能性。

  微信圖片_20220902091258.png

  美國證監(jiān)會文件

  

  對英偉達傷害性不大

  侮辱性極強?

  此次美國政府對英偉達的許可證要求中所涉及的產(chǎn)品包括:A100、H100,以及包括A100或H100的DGX系統(tǒng)。這兩款GPU代表了英偉達官宣產(chǎn)品的最高水平。

  A100基于Ampere架構,發(fā)布于2020年3月,黃仁勛在自家廚房烤箱中端出了這款當時全球最大的7nm芯片,其面積高達826平方毫米,集成了540億個晶體管。相比前代產(chǎn)品,實現(xiàn)了20倍的性能提升,可以同時滿足AI訓練和推理的需求。而DGX A100 AI系統(tǒng)由8個A100 GPU打造而成,單節(jié)點性能達到了5 petaflops。

  H100發(fā)布于今年3月,基于英偉達最新的Hopper架構,集成800億晶體管,采用了臺積電的4nm工藝。其大規(guī)模訓練性能是 A100 的 9 倍,大型語言模型推理吞吐量是 A100 的 30 倍,可以說是英偉達迄今為止最大的性能提升。H100預計今年第三季度開售。

  對于針對這兩款GPU和相關DGX產(chǎn)品的許可要求,一位業(yè)內人士認為“對英偉達傷害性不大,但侮辱性極強”。他認為,A100、H100主要用于云端訓練場景,目前主要在一些高端應用中有需求,而AI推理市場才是規(guī)模更大的應用領域,因此針對這兩款產(chǎn)品的許可要求,本身不會波及到更大規(guī)模的客戶群體。但是,由此對英偉達產(chǎn)生的約束,可能會給競爭對手帶來機會,這是他所認為的“侮辱性”所在。

  此外,由“許可要求”所產(chǎn)生的連鎖反應,可能是需要英偉達和中國客戶所擔心的。由于需要征得許可要求,就意味著英偉達要將自己的客戶名單提供給美國政府,由其評估是否發(fā)放許可。

  這是否會暴露英偉達的市場動向或商業(yè)路線圖?更進一步說,一旦英偉達提供,會不會導致有這一高端需求的企業(yè)出現(xiàn)在美國的“名單”之上?這可能是未來的采購中,買賣雙方都需要“掂量”的。

  

  英偉達在中國

  高端GPU之路受阻?

  據(jù)了解,這一許可證要求不僅涉及現(xiàn)有的A100、H100和相應的DGX系統(tǒng),并且還將涉及英偉達未來的高端GPU芯片,其峰值性能和芯片間的I/O性能,只要是超出A100閾值的,都在許可證所要求的行列中。

  也就是說,不只是現(xiàn)有的產(chǎn)品,在規(guī)劃中的更為高端的GPU產(chǎn)品都將面臨同樣的挑戰(zhàn)。

  那么,對于英偉達及其客戶來說,是否還有一定的“回旋余地”?

  根據(jù)英偉達給SEC的申報內容,他們正在與中國客戶接觸,并尋求“用不受許可證要求的產(chǎn)品”來滿足他們的計劃或未來的購買需求。當然,如果客戶確實需要許可要求中所涵蓋的產(chǎn)品,英偉達也將為客戶去申請,但無法保證美國政府為任何客戶授予任何豁免或許可,也無法確保許可的及時性。

  申報內容原文如下:

  the Company is engaging with customers in China and is seeking to satisfy their planned or future purchases of the Company’s Data Center products with products not subject to the new license requirement. To the extent that a customer requires products covered by the new license requirement, the Company may seek a license for the customer but has no assurance that the USG will grant any exemptions or licenses for any customer, or that the USG will act on them in a timely manner.

  不過,一位業(yè)內人士大膽推測,或許可以通過軟件或硬件手段的調整,能夠在不觸發(fā)許可要求的范圍內保證技術的正常流通,以確保原有科技基礎設施的運轉,為有利于社會的科技發(fā)展提供正常支持。

  英偉達GPU上有效的軟硬件配合一直是廣受用戶推崇的一大優(yōu)勢,通過軟件優(yōu)化,可以更好地發(fā)揮硬件的算力和性能。不過,既然軟件可以提升硬件效能,那么是不是也可以通過軟件調整,去降低硬件性能,使之“恰好”低于A100的閾值?

  別忘了英偉達之前就這樣操作過。當時,為了保證GPU顯卡真正用于游戲市場,而不是被作為以太坊挖礦之用,英偉達就對RTX 3060進行了軟件設計,一旦檢測到以太坊加密貨幣挖掘算法,就會對其產(chǎn)品進行效率降低,將其哈希率(加密貨幣挖掘效率)限制在實際效率的50%左右。

  同時,如果配合足夠快的量產(chǎn)節(jié)奏,也可以對原有的硬件設計調整后重新封裝量產(chǎn),以新的產(chǎn)品系列上市,是否也具有一定的可行性?

  

  中國市場

  GPU之外的xPU迎來利好?

  在AI訓練過程中,需要借助已有的大量數(shù)據(jù)樣本進行學習,對計算的精度要求較高,因此要求訓練芯片要具備強大的單芯片計算能力,目前GPU芯片普遍被認為適合于承擔訓練負載。

  隨著AI應用的逐步豐富,AI大模型的突破被認為是進一步增強AI通用性的一種路徑,也是當前支持AI基礎研究和產(chǎn)業(yè)化落地的關鍵。另一方面,工業(yè)數(shù)字孿生等應用場景開始著力打造工業(yè)元宇宙,推動數(shù)實融合、數(shù)字化轉型的進程。這些都離不開高端算力和龐大算力平臺的支撐。

  根據(jù)信通院的統(tǒng)計數(shù)據(jù),我國算力市場2018-2020年每年增速保持在40%以上,且智能算力占比逐年提升。在如此蓬勃、一路向好的市場環(huán)境中,需求總是存在的,如果英偉達由此受到?jīng)_擊,誰會有望分食蛋糕?

  微信圖片_20220902091727.png

  結合英偉達約一周前發(fā)布的第三財季展望,預計最新下達的許可要求可能會影響它在中國市場約4億美元的潛在收入。這或許就是其他玩家的潛在蛋糕規(guī)模。

  首先在國際廠商方面,英特爾面向數(shù)據(jù)中心的Flex系列 GPU(曾用代號Arctic Sound)剛剛宣布已經(jīng)就緒,將在未來幾個月內開始交付。

  其次,對于正在成長中的國產(chǎn)GPU廠商和其他AI加速芯片廠商,未嘗不是一個機會。

  數(shù)據(jù)中心要求絕對的穩(wěn)定性,服務器廠商原本不會輕易切換新硬件,但如果原有的采購方案受阻,對于新的硬件提供商來說,或許正是新的擴張機會。就像華為被斷供之后,也確實成就了其他幾家頭部廠商的崛起。

  寫在最后

  與英偉達同時收到許可要求通知的還有AMD,這一要求在通知下發(fā)之時即刻生效。據(jù)了解,已經(jīng)在中國境內的現(xiàn)貨不受許可約束,這或許可以給相關客戶留有一定的緩沖余地。

  不過,以上探討的只是可能性和權宜之計。從更長的時間周期來看,中國市場的高端GPU應用難免會受到影響,比如科學計算、醫(yī)療、互聯(lián)網(wǎng)、金融等領域的高性能計算需求。

  黃仁勛有一句名言“The more you buy, the more you save”。

  以DGX A100為例,它是首個可在單一節(jié)點上提供每秒5千萬億次浮點運算的系統(tǒng)。如果數(shù)據(jù)中心進行AI訓練,使用上一代Tesla P100,需要25個服務器機架,600個CPU,硬件成本1100萬美元,消耗630kW的功耗;而使用DGX A100的話,只需5個并聯(lián)的系統(tǒng),1個機架,成本約100萬美元,消耗28kW的功耗。

  從技術路徑來說,高端GPU的替代手段總是存在的。但是在實際落地中,最終要面臨三大挑戰(zhàn):整體的算力成本、功耗和應用生態(tài),這可能是替代者在短期內需要直面的現(xiàn)實問題。

  全球正處于推進數(shù)字化轉型、著力升級基礎設施的關鍵時期,美國這一要求是對全球自由貿(mào)易體系的進一步傷害,畢竟科技制裁之下,沒有所謂贏家。如果這一許可要求堅持執(zhí)行的話,短期內對英偉達傷害性不大、但侮辱性極強,再從下游應用市場來看,短期也會受到沉重打擊。


 更多信息可以來這里獲取==>>電子技術應用-AET<<

  

微信圖片_20210517164139.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。