4月15日消息,存儲(chǔ)芯片大廠SK海力士近期對(duì)西班牙RISC-V芯片初創(chuàng)公司Semidynamics進(jìn)行了戰(zhàn)略投資,推動(dòng)“以內(nèi)存為中心的AI推理架構(gòu)”。
Semidynamics專注于開發(fā)高性能的RISC-V處理器IP與完整的AI解決方案,核心目標(biāo)是提供比美國(guó)現(xiàn)有方案更具競(jìng)爭(zhēng)力的歐洲替代選擇。SK海力士與Semidynamics的合作將聚焦于將Semidynamics的架構(gòu)與下一代內(nèi)存技術(shù)進(jìn)行優(yōu)化。
目前,Semidynamics與臺(tái)積電合作進(jìn)行3nm RISC-V芯片的流片(tape-out),而上述投資也將用于未來Tape-out及系統(tǒng)層級(jí)開發(fā),包括服務(wù)器機(jī)架平臺(tái)的建置。
Semidynamics不只銷售芯片,而是提供包含硬件機(jī)架與完整軟件棧(Software Stack)的解決方案,確保產(chǎn)品能在數(shù)據(jù)中心環(huán)境中無縫運(yùn)作。Semidynamics CEO Roger Espasa透露,“如果不提供機(jī)架,只提供芯片,對(duì)數(shù)據(jù)中心人士是沒有吸引力的”,因此Semidynamics會(huì)帶著完整機(jī)架方案進(jìn)入市場(chǎng)。他也透露,若有機(jī)會(huì)將會(huì)繼續(xù)往2nm邁進(jìn)。
Semidynamics力拼推第一款引導(dǎo)Linux的AI處理器
Semidynamics最初以設(shè)計(jì)IP起步,核心目標(biāo)是整合既有技術(shù),打造完整的AI解決方案。在底層技術(shù)部分,以Gazzillion技術(shù)讓運(yùn)算引擎能有效處理距離較遠(yuǎn)、延遲較高的內(nèi)存資源。
隨著AI模型越來越大、上下文增加、AI Agent啟動(dòng)需要大量?jī)?nèi)存等“深度推理”變多,內(nèi)存變得越來越重要。
Roger Espasa表示,目前產(chǎn)業(yè)普遍依賴HBM,其性能極佳,但成本高昂且供應(yīng)受限;反之,其他類型內(nèi)存雖然成本較低,但存取速度較慢,若沿用傳統(tǒng)GPU架構(gòu),性能將難以發(fā)揮。Semidynamics的目標(biāo)正是突破這個(gè)限制,讓系統(tǒng)能夠有效利用“非HBM”內(nèi)存,這也是Gazzillion技術(shù)的核心價(jià)值所在。
Espasa指出,傳統(tǒng)CPU架構(gòu)(如Intel或AMD)高度依賴緩存命中率,設(shè)計(jì)目標(biāo)是讓約95%的數(shù)據(jù)存取都在緩存中完成,但在AI工作負(fù)載下則失效,因此英偉達(dá)采用高速HBM來繞過緩存瓶頸。而Gazzillion采取不同路徑,當(dāng)數(shù)據(jù)不在緩存中時(shí),系統(tǒng)不會(huì)像傳統(tǒng)CPU一樣停頓等待,而是持續(xù)推進(jìn)計(jì)算流程,通過架構(gòu)層級(jí)的改變來隱藏內(nèi)存延遲,從而在較慢內(nèi)存條件下仍維持高效運(yùn)作。
為了在數(shù)據(jù)中心實(shí)現(xiàn)“統(tǒng)一內(nèi)存”(Unified Memory),Semidynamics目標(biāo)致力于讓AI系統(tǒng)更容易被編程,Espasa認(rèn)為,過去30年在CPU領(lǐng)域累積的統(tǒng)一內(nèi)存與易用性經(jīng)驗(yàn),并沒有真正延伸到AI架構(gòu)中。當(dāng)前AI生態(tài)更像是各種新創(chuàng)構(gòu)架的拼湊,每個(gè)都試圖成為最佳解決方案,但過度差異化往往導(dǎo)致軟件生態(tài)難以跟進(jìn)。因此,通過Gazzillion技術(shù),目標(biāo)是在數(shù)據(jù)中心層級(jí)真正實(shí)現(xiàn)統(tǒng)一內(nèi)存,并提供簡(jiǎn)單且可延續(xù)的軟件環(huán)境。
Espasa表示,Semidynamics是最早投入RISC-V團(tuán)隊(duì)之一,并且率先開發(fā)RISC-V向量單元(Vector Unit)。他也透露,甚至將會(huì)推出第一款引導(dǎo)Linux的AI處理器,使任何能在Linux上運(yùn)行的軟件都能直接在Semidynamics的加速器上運(yùn)行,“我們不打算為單一模型(如Llama或ChatGPT)打造專用芯片,而是確保提供工具,以便人們可以發(fā)明新東西”。
樂見TurboQuant技術(shù),AI生態(tài)發(fā)展不會(huì)因壓縮技術(shù)改變
Semidynamics的愿景是以品牌“Atrevido”為起點(diǎn),該品牌代表基于自家IP所打造的SoC,并進(jìn)一步向上延伸,整合成系統(tǒng)級(jí)構(gòu)架。其中關(guān)鍵在于我們圍繞核心技術(shù)所建構(gòu)的“內(nèi)存系統(tǒng)”,這不僅是設(shè)計(jì)上的選擇,更是吸引SK海力士關(guān)注的重要原因。
Espasa認(rèn)為,“DeepSeek時(shí)刻”之所以引發(fā)市場(chǎng)關(guān)注,是因?yàn)橐粋€(gè)來自不同路徑的模型在短時(shí)間內(nèi)改變了市場(chǎng)預(yù)期并造成一定程度的恐慌。但他認(rèn)為,這類事件其實(shí)是必然會(huì)反復(fù)出現(xiàn)的現(xiàn)象。未來不一定每六個(gè)月,但幾乎每一年都會(huì)有來自前沿實(shí)驗(yàn)室、大學(xué)或其他研究機(jī)構(gòu)的新突破模型出現(xiàn)。因此,公司必須把“可編程性”作為核心原則,確保無論AI技術(shù)如何演進(jìn),硬件構(gòu)架都能持續(xù)跟隨與適配。
他進(jìn)一步表示,在這樣的環(huán)境下,有許多變化正在被密切觀察。公司每天都高度關(guān)注內(nèi)存市場(chǎng)的動(dòng)態(tài),同時(shí)也持續(xù)追蹤AI模型本身的演進(jìn),例如新的數(shù)據(jù)表示方式與量化技術(shù)的出現(xiàn),甚至已經(jīng)出現(xiàn)如1.2-bit這類極低精度模型。他認(rèn)為,這些創(chuàng)新將持續(xù)推動(dòng)硬件與軟件之間的協(xié)同演進(jìn)。
談到谷歌最新緩存壓縮技術(shù)TurboQuant時(shí),Espasa強(qiáng)調(diào),任何能降低內(nèi)存需求的技術(shù)本質(zhì)上都是正面的,無論是TurboQuant還是其他類似技術(shù),只要能減少內(nèi)存壓力,都對(duì)整個(gè)產(chǎn)業(yè)有利。這類技術(shù)不會(huì)削弱對(duì)硬件的需求,反而可能促進(jìn)模型規(guī)模的進(jìn)一步擴(kuò)張。當(dāng)工具變得更有效率時(shí),使用者通常不會(huì)減少使用,而是選擇「用得更多」,即使TurboQuant降低單位模型的內(nèi)存需求,實(shí)際結(jié)果往往是模型變得更大、應(yīng)用場(chǎng)景更多,整體內(nèi)存消耗并不會(huì)下降。從這個(gè)角度來看,AI生態(tài)的發(fā)展路徑并不會(huì)因壓縮技術(shù)而改變。
他也補(bǔ)充,即便未來出現(xiàn)更多中小型模型,或企業(yè)開始部署多個(gè)Agent系統(tǒng),內(nèi)存需求依然會(huì)持續(xù)擴(kuò)張。因?yàn)橐坏膯我荒P娃D(zhuǎn)向多Agent構(gòu)架,即使每個(gè)模型較小,整體系統(tǒng)的內(nèi)存與運(yùn)算需求仍會(huì)快速累積。因此,無論是模型變大、還是Agent數(shù)量增加,本質(zhì)上都會(huì)推動(dòng)對(duì)內(nèi)存與基礎(chǔ)設(shè)施的長(zhǎng)期需求成長(zhǎng),形成對(duì)整個(gè)產(chǎn)業(yè)都有利的擴(kuò)張循環(huán)。
Semidynamics已從歐洲及西班牙的創(chuàng)新計(jì)劃中獲得4,500萬歐元資金,用于建構(gòu)完整的AI基礎(chǔ)設(shè)施平臺(tái)。
Semidynamics成立于2016年,總部位于巴塞羅那,專注于開發(fā)以內(nèi)存為核心的A I基礎(chǔ)設(shè)施,并采用Gazzillion內(nèi)存子系統(tǒng)技術(shù),旨在解決所謂的“內(nèi)存墻”問題,即處理器速度與內(nèi)存帶寬之間的差距。

