大模型需要大算力,大算力需要大集群,大集群需要大網(wǎng)絡(luò)!
業(yè)界對此沒有疑問,但選擇什么樣的機間互聯(lián)技術(shù),卻有著不同的技術(shù)實現(xiàn)路徑。
是先入為主的InfiniBand,還是當(dāng)前呼聲很高的UEC;其實,我們有更多的選擇。在近日舉行的“中國移動算力網(wǎng)絡(luò)大會”上,中國移動副總經(jīng)理高同慶宣布,對標(biāo)國際主流的IB和UEC方案,形成中國自主的技術(shù)體系--全調(diào)度以太網(wǎng)(GSE),今年將開展GSE中試,加速GSE關(guān)鍵技術(shù)和產(chǎn)業(yè)成熟,為標(biāo)準(zhǔn)開放的新型智算互聯(lián)貢獻中國方案。
有了IB和UEC,我們?yōu)槭裁催€需要GSE?GSE將會給產(chǎn)業(yè)界帶來價值?從理念到技術(shù)再到產(chǎn)品和應(yīng)用的落地,GSE還需要邁過哪些門檻?
我們?yōu)槭裁葱枰狦SE
在回答這個問題之前,先讓看看算力形態(tài)的變化。業(yè)界現(xiàn)在將算力分為通算、超算與智算,其中智算作為AI能力的主要載體,到2025年可能會占據(jù)新增算力的85%左右。也就是說智算將逐漸成為AI市場主流,作為智算的載體,智算中心的重要性就不言而喻了。
智算中心與傳統(tǒng)數(shù)據(jù)中心存在很大不同,不僅體現(xiàn)在卡型、性能、功耗、算力密度等方面,主要由GPU服務(wù)器聯(lián)網(wǎng)構(gòu)成的智算中心需要完全不同的網(wǎng)絡(luò)架構(gòu)。當(dāng)大模型訓(xùn)練時,并行計算節(jié)點越多,通信效率越重要,智算網(wǎng)絡(luò)性能成為集群算力提升的關(guān)鍵。總結(jié)下來,智算中心網(wǎng)絡(luò)要求很特殊,需要高帶寬、零丟包、超低時延、高可用性,月級零故障。
簡言之,我們需要新的網(wǎng)絡(luò)架構(gòu)??陀^來看,英偉達主導(dǎo)的InfiniBand因其自身特性,是當(dāng)前市場主流選擇,但InfiniBand在產(chǎn)業(yè)開發(fā)性、部署成本方面非常不友好。還有很重要的一點,在云譎波詭的地緣政治環(huán)境下,產(chǎn)品與解決方案的可持續(xù)獲得性也是個問題。
InfiniBand不行,我們可以選另外一條技術(shù)演進路徑,從底層革新傳統(tǒng)以太網(wǎng)機制,同時又最大限度的利用以太網(wǎng)產(chǎn)業(yè)的開放性和成熟性。亂拳打死老師傅,這的確是個好主意!
從以太網(wǎng)這條技術(shù)路徑來看,主要有兩個流派。一種是采用大量的私有協(xié)議,自己做深度優(yōu)化,性能的確是很強,國內(nèi)有些云服務(wù)商走的是這條路;一種是用開源社區(qū)思路,“眾人拾柴火焰高”,比如國內(nèi)主導(dǎo)的GSE,是美國主導(dǎo)的UEC,都是這個思路。
但需要強調(diào)的是,UEC和GSE的先后關(guān)系。很多人先入為主的認(rèn)為,我國在智算領(lǐng)域落后于美國,GSE是在拾UEC牙慧!但事實剛好與之相反。在2023年5月份,中國移動聯(lián)合10余家中國企業(yè)率先發(fā)布全調(diào)度以太網(wǎng)技術(shù)架構(gòu)(GSE)白皮書,這標(biāo)志著GSE技術(shù)的確立。幾個月之后,包括英特爾、AMD、HPE、Arista、Broadcom、思科、Meta和微軟等主導(dǎo)成立的超級以太網(wǎng)聯(lián)盟(UEC)才成立。
GSE能夠給行業(yè)帶來什么?我覺得最重要的有兩點:
第一,給了智算中心服務(wù)器互聯(lián)更多選擇。在云譎波詭的地緣政治環(huán)境下,可選擇性、可獲取性比性能、成本本身更為重要。況且,GSE也在快速的走向成熟,形成標(biāo)準(zhǔn)開放的技術(shù)體系!
第二,給了中國AI產(chǎn)業(yè)路徑更多選擇。在先進算力芯片受限的前提下,我們只能通過別的方式來彌補,“以網(wǎng)強算”是個必然路徑。但網(wǎng)絡(luò)芯片存在代際差距,網(wǎng)絡(luò)可能成為我國AI發(fā)展的“新卡點”。我們單純的從這個公式來看:集群有效算力={GPU單卡算力*總卡數(shù)*線性加速比*有效運行時],前面這幾個變量我們都受限,更需要做好GSE這篇文章。
GSE應(yīng)該怎么去落地?
首先,我們要有自信。AI特別是AGI就是未來的方向,在這點上,是沒有任何疑問的。在AGI落地的技術(shù)路徑上,“以網(wǎng)強算”是個必然選擇。
我們有全球最好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,有全球最好的移動通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,有全球技術(shù)最為領(lǐng)先的400G光傳送網(wǎng)。當(dāng)然,我們也完全可以有最優(yōu)的智算中心網(wǎng)絡(luò),或者智算中心機間互聯(lián)技術(shù)生態(tài)。在挑戰(zhàn)或者取代IB的這條道路上,UEC可以做到的,GSE為什么不能做到呢?
其次,產(chǎn)業(yè)鏈形成合力。孫凝暉院士說的好,國內(nèi)智能計算生態(tài)孱弱,更為嚴(yán)重的是國內(nèi)企業(yè)之間山頭林立,其實在機間互聯(lián)技術(shù)選擇上也一樣。比如在今年的云網(wǎng)智聯(lián)大會上,就有類似的聲音出來,認(rèn)為GSE是中國移動主導(dǎo)的,是個個體行為,UEC才是主流。
從全球來看,特別是從用戶的CAPEX來看,UEC的確是遠(yuǎn)遠(yuǎn)超過GSE;但國內(nèi)企業(yè)在UEC中到底有沒有,有多少話語權(quán),這都是疑問。對于GSE而言,的確是中國移動倡導(dǎo)成立的,但GSE發(fā)展離不開開放性,GSE推進計劃現(xiàn)在已經(jīng)有40多家成員,既要最大限度兼容以太網(wǎng)生態(tài),更要最大限度包容產(chǎn)業(yè)生態(tài)。
還是要小步快跑。智算中心的發(fā)展和演進,和傳統(tǒng)的CT行業(yè)是不同的,標(biāo)準(zhǔn)是個很有意思的問題,是在發(fā)展中不斷地凝聚共識、優(yōu)化技術(shù)路徑;小步快跑才能形成可持續(xù)的社區(qū)繁榮生態(tài)。從GSE的發(fā)展歷程來看,也的確在朝著這個方向前行。特別是在上個月,《新型智算中心以太網(wǎng)物理層安全(PHYSec)架構(gòu)白皮書》的發(fā)布,說明了GSE產(chǎn)業(yè)鏈的努力。
最后,當(dāng)然也是最重要的,要用“誠意”和“信心”去培育、催熟產(chǎn)業(yè)鏈。所以,在今年的中國移動算力網(wǎng)絡(luò)大會上,當(dāng)高總宣布要開展GSE“中試”時,產(chǎn)業(yè)鏈還是很受鼓舞的??赡苡行┳x者對于“中試”不是很清楚,翻譯過來的意思就是“現(xiàn)網(wǎng)試商用”!這也凸顯了中國移動在推動民族智算和AI產(chǎn)業(yè)發(fā)展中的央企擔(dān)當(dāng)。當(dāng)然,我們也相信中國移動具備這樣的能力,無論是從傳送網(wǎng)100G到400G的躍遷,還是從移動網(wǎng)從3G到5G的嬗變,或亦是承載網(wǎng)從PTN到SPN的沿革,中國移動都已經(jīng)證明了自己。GSE,我們相信同樣如此!