《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 業(yè)界動態(tài) > 業(yè)界 | 一統(tǒng)所有AI芯片:Facebook揭秘深度學習編譯器Glow

業(yè)界 | 一統(tǒng)所有AI芯片:Facebook揭秘深度學習編譯器Glow

2018-09-15

一名 Facebook 高管在最近的一次活動中證實,這家社交網(wǎng)絡巨頭正在招募芯片工程師,并已在設計至少一種 ASIC。在本周的 Facebook @Scale 2018 大會上,F(xiàn)acebook 宣布五家芯片公司將支持 Glow(這是一個開源的深度學習編譯器),其中包括英特爾、Marvell、高通、Esperanto 和 Cadence。


「Facebook 確實正在組建芯片團隊,不僅與芯片供應商合作,我們也在構建自己的芯片。當然,這不是我們的首要目標,」Facebook 基礎設施副總裁 Jason Taylor 表示。這位高管稱 Facebook 的目標并不等同于谷歌的深度學習加速器 TPU,但他拒絕透露發(fā)布時間節(jié)點等更多具體細節(jié)。

微信圖片_20180915211449.jpg


與多達 50 家 AI 加速器設計公司進行合作是 Facebook 新設芯片部門的工作重點?!改壳笆忻嫔弦延泻芏喾N加速芯片,」Taylor 表示,「最大的問題是,它們針對的工作負載是否是當前最重要的?!?/p>


在 Keynote 中,Taylor 將 Glow 描述為一種通用編譯器,可讓開發(fā)人員針對所有新興的深度學習加速器進行推理——在云端或者邊緣網(wǎng)絡。它不面向手機等客戶端系統(tǒng)。


「我們預計深度學習加速器硬件也會出現(xiàn)碎片化的情況,我們在 Glow 上的工作是為了幫助機器學習專家設計神經(jīng)網(wǎng)絡,并讓他們從對每種特定芯片的適配工作中解脫出來。」Taylor 表示。「我們知道碎片化即將到來,現(xiàn)在沒有人知道哪種硬件資源的組合(如片上存儲模塊和乘法累加陣列)會最終取勝。所以我們讓開發(fā)者聚焦于更高層級的計算圖中,而無需動手動編碼針對硬件的細節(jié)?!?/p>

微信圖片_20180915211515.jpg

Jason Taylor 將 Glow 描述為在云端和邊緣網(wǎng)絡上進行推斷的編譯器。(圖源:Facebook)


Glow 采用 TensorFlow 或 Caffe2 等框架生成的 AI 圖像,然后將它渲染成用于硬件加速器的字節(jié)代碼,Taylor 解釋道。該編譯器包括多個工具,如用來生成用于芯片特定內(nèi)存配置的指令排程器、線性代數(shù)優(yōu)化器、內(nèi)存分配器,以及用來測試硬件準確率的基于 CPU 的推斷實現(xiàn)。


益華(Cadence)、Esperanto Technologies、英特爾、Marvell 和高通稱它們未來的芯片將支持 Glow。Taylor 期待將其他芯片廠商也添加到支持 Glow 的廠商名單上?!高@是開源 Glow 的好處之一?!?/p>


一名高級芯片專家將 Glow 描述為在生產(chǎn)系統(tǒng)中部署神經(jīng)網(wǎng)絡的框架。其輸入是 TensorFlow 或 Caffe2 等框架創(chuàng)建的圖。


一些著名的芯片廠商已經(jīng)開始支持類似的軟件。例如,英偉達的 Tensor RT 將來自框架的圖作為輸入,然后為 GPU 輸出 Cuda 代碼。


傳統(tǒng)上,編譯器是針對特定芯片進行嚴格優(yōu)化的。但是 Taylor 表示,「當前編譯器的編譯范圍要比過去大得多——Glow 中的優(yōu)化類型要識別可以渲染給硬件加速器的圖像中的很大一部分?!?/p>


在快速發(fā)展的深度學習領域,Glow 是努力彌補軟硬件差距的最新例子。例如,英偉達的 Tensor RT 現(xiàn)在已經(jīng)發(fā)展到第五代,盡管其第一代僅在一年前發(fā)布。一些加速器初創(chuàng)公司對支持各種軟件框架及其變化所需的工作水平有些無能為力。


Facebook、微軟等公司正在支持 ONNX,這是一種用權重表示圖形的標準方法。去年 12 月份,Khronos 的團隊發(fā)布了深度學習加速器的一個硬件抽象層——NNEF。


Glow 是 Pytorch 1.0 的一個組成部分,后者是一個開源項目集,包括合并的 Caffe2 和 Pytorch 框架。Pytorch 1.0 的第一次開發(fā)者大會將于 10 月在舊金山舉行。


在另一個演講中,F(xiàn)acebook 工程經(jīng)理 Kim Hazelwood 展示了 Facebook 使用的十多個不同深度學習工作負載,它們部署在至少四個不同類型的神經(jīng)網(wǎng)絡上。每天 Facebook 生成超過 200 萬億次推斷,翻譯 50 多億文本,并自動刪除超過一百萬虛假賬號。


她說,F(xiàn)acebook 的一些推斷任務需要的計算量是其它任務的 100 倍。如今,F(xiàn)acebook 在其設計的一小部分 CPU 和 GPU 服務器上運行這些任務。


Hazelwood 告訴 EE Times,從通用硬件轉向定制硬件將需要針對那些仍在變化的工作負載定制芯片。她拒絕透露 Facebook 關于使用任何定制 AI 加速器的想法。

微信圖片_20180915211540.jpg

僅 Facebook 就在十幾個深度學習應用中使用了至少五種神經(jīng)網(wǎng)絡。


一位觀察者推測,Glow 將是一個理想的工具,使公司能夠采用一些適合其各種工作負載的加速器。其半導體團隊可以幫助公司精選芯片,也許還可以為其中一些公司提供定制芯片的建議。


另外,F(xiàn)acebook 發(fā)布了一篇博客,描述了它創(chuàng)建的一個新軟件工具,該工具使用深度學習來調(diào)試代碼。它說,SapFix 可以自動生成特定錯誤的補丁,然后將其提交給工程師審批并部署到生產(chǎn)中。


迄今為止,F(xiàn)acebook 已經(jīng)使用 SapFix 加快了向裝有 Facebook Android 應用程序的數(shù)百萬臺設備發(fā)送代碼更新的進程。Facebook 表示將發(fā)布該工具的一個版本,但沒有說明發(fā)布時間。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。