《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 阿里巴巴第一款AI芯片背后,有什么深層次思考?

阿里巴巴第一款AI芯片背后,有什么深層次思考?

2023-01-02
來源:21ic
關(guān)鍵詞: 阿里 AI 芯片

昨天,阿里巴巴發(fā)布了第一款AI芯片——含光800。除了參數(shù)外,還有怎樣的故事和深層次考慮?最近一兩年,只要國內(nèi)有公司發(fā)布AI芯片,就會在各大社交圈、媒體中炸開鍋。日子過不了多久,就會淡去,留下三三兩兩歷史記錄中的文章。但我們很少知道背后的故事,這并不是幾日的技術(shù)狂歡所能說清的。昨天,阿里巴巴發(fā)布了第一款AI芯片——含光800。合著云棲大會的熱鬧,該芯片瞬間成為了近日最閃耀的頭條新聞。當阿里CTO張建鋒在會議廳展示這塊芯片時,介紹很簡短,除了參數(shù)外,并沒有介紹背后的故事。

“前幾天,我們都還不知道能不能完成。只能每周干7天,每晚干到12點。就在15號凌晨時,我們最后一批人早上5點20離開(實驗室),終于調(diào)出來了。當時很多人說不可能,但我們做到了?!?阿里巴巴達摩院平頭哥AI芯片研究員焦陽(驕旸)在接受TechSugar等媒體采訪時,說到了這款芯片背后的故事。

故事的開頭夾雜的質(zhì)疑,故事的結(jié)尾如這批研究員所愿。

這顆芯片

7個月完成了前端設(shè)計,之后用3個月就成功流片,速度的確驚人。

據(jù)現(xiàn)場介紹,在業(yè)界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大腦的業(yè)務測試中,1顆含光800的算力相當于10顆GPU。

人工智能芯片分論壇中,焦陽介紹了更多該芯片的細節(jié),如下兩張圖。

含光800采用四核設(shè)計,其包含170億顆晶體管,采用臺積電的12nm工藝。之所以采用四核架構(gòu),焦陽表示:“在設(shè)計之后,由于良率提升需求,四個Core任何有一個Core壞死,都不影響芯片工作,這是我們在架構(gòu)設(shè)計時做的特別處理?!?/p>

此外,計算單元盡量被放在了存儲邊上,這是功耗做的很低的原因。

含光800性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達摩院算法,針對CNN及視覺類算法深度優(yōu)化計算、存儲密度,可實現(xiàn)大網(wǎng)絡模型在一顆NPU上完成計算。

含光800已開始應用在阿里巴巴內(nèi)部核心業(yè)務中。根據(jù)云棲大會的現(xiàn)場演示,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。

含光800將通過阿里云對外輸出AI算力?;诤?00的AI云服務當天正式上線,相比傳統(tǒng)GPU算力,性價比提升100%。

過去半年,平頭哥先后發(fā)布玄鐵910、無劍SoC平臺。隨著含光800的發(fā)布,平頭哥端云一體全棧產(chǎn)品系列初步成型,涵蓋處理器IP、一站式芯片設(shè)計平臺和AI芯片,實現(xiàn)了芯片設(shè)計鏈路的全覆蓋。

張建鋒說:“在全球芯片領(lǐng)域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走?!?/p>

到底怎么想的?

在發(fā)布會結(jié)束后,筆者從分論壇中,了解到了這款NPU更多的故事和背后的想法。首先是為什么——阿里巴巴為什么要做云上大芯片?

從焦陽的回答中,筆者總結(jié)為以下幾點:

1,阿里巴巴云計算是一個快速增長的業(yè)務,在業(yè)內(nèi)處于領(lǐng)先地位。硬件設(shè)計可以幫助阿里巴巴快速拓展業(yè)務,降低計算成本,提供海量的計算能力。云計算走到今天,如果沒有硬核就很難繼續(xù)往下走,未來很難在算力上有更多的提高。

2,這不是為了短期商業(yè)化,而為更遠的愿景。以技術(shù)為本,打造過硬的技術(shù)。

3,為什么做推理而不是訓練?雖然在AI發(fā)展中,第一步都是要做很多的訓練,但隨著算法高速發(fā)展之后,將迎來推理端的發(fā)展。阿里巴巴涉及的業(yè)務,如城市大腦、視覺分析等,算力大大提高其計算效率,把真正的業(yè)務量達到突破,從而在云計算中增加更多流量,解決未來業(yè)務發(fā)展目標。

4,阿里巴巴與傳統(tǒng)互聯(lián)網(wǎng)公司不同,除了搜索和廣告業(yè)務,還有更豐富的視覺類業(yè)務,如淘寶圖片、搜索、智能城市、智能工廠等?;谶@些業(yè)務,CNN加速是對NPU的一個重要方向點,此外阿里還將擴展到新的模式適配。(如下圖)

在提到未來芯片計劃時,焦陽非常務實地說道:“第一步先把技術(shù)做深做扎實,達摩院或者其他的技術(shù)團隊,目前都在做很多的項目,我們需要從業(yè)務中了解業(yè)務,不能僅限于只做業(yè)務,需要舉一反三,來產(chǎn)生更有深度,更有技術(shù)水平的產(chǎn)品。含光雖然已經(jīng)取得了初步的結(jié)果,但這遠遠不夠,我們要達到英偉達的水平還有很長的路要走,有了好技術(shù)才能有章可循,沒有技術(shù),連推產(chǎn)品都推不動?!?/p>

“AI芯片是新的領(lǐng)域,新領(lǐng)域本身就存在很多機會。而且人工智能算法是需要特殊架構(gòu)的,對于阿里巴巴來說,就是挑戰(zhàn)皇冠上的明珠?!庇?0年GPU領(lǐng)域工作經(jīng)驗的焦陽,談到公司未來也是充滿信心。

阿里芯片的邊界

前不久,看到新聞上提到馬云在阿里巴巴卸任現(xiàn)場上演唱了《怒放的生命》時,我突然發(fā)現(xiàn),凡人已經(jīng)很難阻止阿里巴巴了。

2017年,宣布成立達摩院;2018年成立平頭哥;2019年便掏出了這一款AI芯片。對2020年的大事,目前筆者還沒嗅到什么消息,憑借阿里的想象力,總預感會有大事發(fā)生。

其實在芯片這塊,阿里巴巴的所涉及的部分已經(jīng)超過一般人所知。

阿里巴巴集團副總裁周明的題為《阿里巴巴基礎(chǔ)設(shè)施挑戰(zhàn)與芯片策略》的演講中提到,如今阿里在技術(shù)分布有CPU、異構(gòu)計算、NPU、FPGA;互聯(lián)和網(wǎng)絡部分則有自研網(wǎng)絡交換機及NOS、自研400G硅光模塊、HAIL2.0數(shù)據(jù)中心網(wǎng)絡架構(gòu);存儲端集合了從SSD到DRAM到新型存儲截止愛到服務器的一體機,其中包括AliFlash V3、AliFlash V5.0、阿里巴巴自研云計算服務器、阿里巴巴邊緣云服務器。

    因為基礎(chǔ)設(shè)施的加持,才有云棲大會第一場主論壇中,阿里巴巴董事局主席兼首席執(zhí)行官張勇對數(shù)字經(jīng)濟的暢想,他表示:“在數(shù)字經(jīng)濟時代,大數(shù)據(jù)是石油,而算力是引擎。算力不僅代表計算的規(guī)模和計算的效率,同時它也包括數(shù)量的要求、智慧的程度。算力的發(fā)展,最終一定是“數(shù)”和“智”全面結(jié)合。只有這樣,我們才能夠在走向數(shù)字化的同時,真正走向未來我們共同相信會全面爆發(fā)的智慧化、數(shù)智化?!?/p>





更多信息可以來這里獲取==>>電子技術(shù)應用-AET<<

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。