《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 華為昇騰910聯(lián)手阿里含光800拉開“地表最強芯”大幕

華為昇騰910聯(lián)手阿里含光800拉開“地表最強芯”大幕

2019-10-09
關(guān)鍵詞: 芯片 華為 阿里 昇騰

當(dāng)下這個階段,如果你的芯片沒有一個某某性能最強的標(biāo)志,那么奉勸你不要來國產(chǎn)芯片發(fā)布的圈子湊熱鬧?,F(xiàn)在,這里是“地表最強”芯片的舞臺。

1569569357551031200.jpg

8月23日,華為在深圳總部推出AI處理器Ascend 910(昇騰910)。華為輪值董事長徐直軍表示,昇騰910總體技術(shù)表現(xiàn)超出預(yù)期,作為算力最強AI處理器,當(dāng)之無愧。

1569569357729018906.png

圖片來源于華為官網(wǎng)

無獨有偶。9月25日,杭州云棲大會上,達(dá)摩院院長張建鋒現(xiàn)場展示了最強的AI推理芯片含光800。張建鋒表示,在業(yè)界標(biāo)準(zhǔn)的ResNet-50測試中,含光800推理性能達(dá)到78563 IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

看到這里,大家發(fā)現(xiàn)阿里、華為對于“最”字的應(yīng)用是不是過于隨意了?這看起來更像是文字游戲,之后所有在某一領(lǐng)域拔尖的芯片都可以用這樣的方式冠以“地表最強”的稱號。

但我們無力反駁。昇騰910確實是目前算力最強的AI芯片,而含光800也確實是目前AI推理能夠力最強的芯片。

無論如何,昇騰910和含光800在中國芯片歷程上都有著自己突出的貢獻(xiàn),在我們的芯片發(fā)展史也都會寫下濃墨重彩的一筆。

昇騰910-最快的訓(xùn)練芯片

昇騰910搭載的是華為自研的達(dá)芬奇架構(gòu),達(dá)芬奇從IP到指令集都是華為自己的專家創(chuàng)造的,并且支持全場景人工智能應(yīng)用。昇騰910的算力是國際頂尖AI芯片的2倍,相當(dāng)50個當(dāng)前最新最強的CPU。因此,昇騰910的訓(xùn)練速度比當(dāng)前最新最強的芯片提升了50%-100%。

昇騰910 AI處理器內(nèi)置32個達(dá)芬奇AI Core,基于臺積電7nm增強版EUV工藝。除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。在算力方面,昇騰910芯片達(dá)到了設(shè)計規(guī)格(半精度(FP16)256Tera-FLOPS;整數(shù)精度(INT8)512Tera-OPS)。此外,昇騰910芯片達(dá)到規(guī)格算力所需功耗(310W)低于設(shè)計值(350W)。

在華為全聯(lián)接2019大會上,華為發(fā)布了全球最快AI訓(xùn)練集群華為Atlas 900。其就是基于數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計算能力。

1569569358122042137.jpg

圖片來源于華為官網(wǎng)

含光800-最強的推理芯片

含光800是一款云端AI推理芯片,峰值性能為7.8萬IPS(每秒能處理7.8萬張照片),峰值能效達(dá)到500IPS/W。據(jù)介紹,1顆含光800的算力相當(dāng)于10顆GPU,目前基于含光800的AI云服務(wù)已在阿里云上線。

1569569358261067648.png

圖片來源于平頭哥官方宣傳圖

含光800不同于基于馮·諾依曼架構(gòu)的傳統(tǒng)通用處理器,而是根據(jù)神經(jīng)網(wǎng)絡(luò)推理運算特征,設(shè)計特定的硬件神經(jīng)元、高速連接的存儲結(jié)構(gòu)以及專用指令集,對內(nèi)存和計算單元實現(xiàn)高效組織管理,實現(xiàn)單條指令完成多個操作,提高計算效率和內(nèi)存訪問效率。

含光800在算法方面也得到了加強。阿里巴巴達(dá)摩院機器智能實驗室過去兩年構(gòu)建了完整的算法體系,涵蓋語音智能、語言技術(shù)、機器視覺、決策智能等方向,并且取得多個世界領(lǐng)先水平的成果。

不管是訓(xùn)練還是推理都需要強大的算力支撐,而兩塊芯片都表現(xiàn)了優(yōu)異的性能。

經(jīng)實測,昇騰910 打造的Atlas 900可以在60秒完成基于Resnet-50模型訓(xùn)練,比第2名快15%。這可以讓研究人員更快的進(jìn)行圖像、語音的AI模型訓(xùn)練,讓人類更高效的探索宇宙奧秘、預(yù)測天氣、勘探石油,加速自動駕駛的商用進(jìn)程。在一張匯聚有20萬顆星星的南半球星空圖上,天文學(xué)家想找出某種特征的星體,需要169天的工作量,Atlas 900只需要10秒。

在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。

昇騰910和含光800有一個共同點,都不單獨對外銷售。昇騰910通過AI加速模塊、AI加速卡、AI服務(wù)器等形式對第三方銷售;含光800將通過阿里云對外輸出AI算力。

昇騰910和含光800可謂是術(shù)業(yè)有專攻,各自有各自的特點。不管是訓(xùn)練還是推理,在AI應(yīng)用落地中都至關(guān)重要,兩款芯片能夠在各自的領(lǐng)域做到世界第一,足見各自背后團(tuán)隊的真功夫。同時,這些有著中文古典名字的芯片不斷涌現(xiàn)也代表著國產(chǎn)芯的欣欣向榮。如果有其他的企業(yè)能夠做到這一點,相信大家也愿意繼續(xù)被這樣的“文字游戲”所套路。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。