《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業(yè)界動態(tài) > OneAPI:天下大同

OneAPI:天下大同

2020-01-23
來源:EETOP
關鍵詞: OneAPI 英特爾

  OneAPI英特爾在生態(tài)布局中最重要的一環(huán),這已經不是什么秘密了。早在2018年底舉行的英特爾架構日上,英特爾的芯片首席架構師Raja Koduri就對外公布了公司正在著力研發(fā)的一件“大事”:一個名為OneAPI的軟件編程框架。

  OneAPI相關的技術資料和編程指南,已上傳至知識星球“老石談芯-進階版”,請在文末掃碼進入星球查看。

640.webp (2).jpg

  (圖片來自anandTech)

  OneAPI:夢想照進現(xiàn)實?

  顧名思義,OneAPI旨在提供一個適用于各類計算架構的統(tǒng)一編程模型和應用程序接口。也就是說,應用程序的開發(fā)者只需要開發(fā)一次代碼,就可以讓代碼在跨平臺的異構系統(tǒng)上執(zhí)行,底層的硬件架構可以是CPU、GPU、FPGA、神經網絡處理器,或者其他針對不同應用的硬件加速器等等。

  OneAPI的口號是“No transistor left behind”,老石把它翻譯成“晶體管一個也不能少”,這也很形象的總結了OneAPI的終極目標。

640.webp (1).jpg

  很多人在看到OneAPI之后的第一反應,都是三個字:不可能。有些略顯極端的媒體甚至認為,OneAPI已經超出科幻小說的范疇,實在難以置信。

  這些懷疑的聲音并非毫無依據,應用程序的跨平臺優(yōu)化一直是業(yè)界研究的熱點和重點之一。而OneAPI希望一次性解決四個硬件架構的異構編程問題,無異于在游戲開始就選擇了地獄難度。

  夢想還是要有的,萬一實現(xiàn)了呢?

  對于大多數(shù)應用程序的開發(fā)者來說,使用高級語言編程已經成為了再平常不過的事情。試想一下,你上一次寫C++或Python、并需要知道特定處理器指令的操作碼是什么時候?

  事實上,現(xiàn)有的高級語言編譯器已經很好的將程序開發(fā)與底層的計算機體系結構分離開來。這使得應用程序開發(fā)者可以專注于算法和應用的開發(fā),而無需關心太多底層的CPU究竟如何實現(xiàn)程序。

  然而,隨著應用的復雜性不斷增加,對算力的要求也逐漸加大。此時,單純依靠堆積CPU內核已經無法滿足應用程序對于性能、實時性、功耗、成本等等的要求。人們開始使用越來越多的非CPU計算單元,比如GPU、FPGA、以及各種針對不同應用而開發(fā)的專用芯片等。這些硬件加速器與CPU一起組成了復雜的異構平臺。

  為了發(fā)揮這個異構平臺的最大性能,開發(fā)者需要深入了解底層硬件的體系結構,以及一系列的特定開發(fā)手段和技巧,以便針對性的利用各個異構單元的優(yōu)勢。

  拿FPGA來說,如果按開發(fā)軟件的思路去開發(fā)FPGA硬件,比如使用了各種循環(huán)嵌套、多層條件分支等等,恐怕只會得到一個連時序都無法收斂的FPGA設計。同樣的,如果想用GPU做一些加速運算,那么最好在團隊中有人對CUDA或OpenCL等有豐富的經驗,否則就有可能白白消耗了GPU的高功耗而收效甚微。

  這里只有一個問題:對于普通的軟件工程師或算法工程師而言,了解和掌握這些硬件相關的開發(fā)知識幾乎是不可能的。

  而這正是OneAPI希望解決的痛點(引自英特爾):

  “OneAPI 提供一個通用、開放的編程體驗,讓開發(fā)者可以自由選擇架構,無需在性能上作出妥協(xié),也大大降低了使用不同的代碼庫、編程語言、編程工具和工作流程所帶來的復雜性”。

  OneAPI:HLS的進化形態(tài)?

  具體來說,英特爾將旗下的芯片架構分成了SVMS四類,即:

  標量(Scalar):CPU

  矢量(Vector):GPU

  矩陣(Matrix):AI芯片

  空間(Special):FPGA

640.webp.jpg

  這四類架構分別有各自的優(yōu)勢和適用范圍,同時也有著各自的編程模型和方法。

  以FPGA為例,F(xiàn)PGA的硬件可編程性一直是它最主要的特點,也是與其他硬件加速器相區(qū)分的重要特性。然而,對FPGA進行編程遠遠沒有聽起來那么簡單,這在老石之前的文章中也詳細介紹過多次。其中最大的難點,就是要使用硬件描述語言(HDL)對電路行為進行建模,而且這種建模往往有著比較低的抽象程度。

  也就是說,F(xiàn)PGA開發(fā)者需要將待實現(xiàn)的算法進行分解、并行化、設計流水線,使其成為一個個數(shù)據通路或控制電路,同時還要設計數(shù)據的存儲和讀取方式、各種時鐘域的同步、進行時序收斂等諸多優(yōu)化,以符合系統(tǒng)的功耗、吞吐量、精度、面積等需求。這還不包括電路仿真、調試,以及在軟件層面需要做的一系列工作。

  這樣,為了做出一個真正優(yōu)化過的FPGA設計,往往需要一個有著豐富設計經驗的團隊協(xié)同合作。而就算有這樣的團隊,在處理一個再常見不過的for循環(huán)嵌套時,都可能花費長達數(shù)月的時間進行FPGA的硬件實現(xiàn)與性能調優(yōu)。只需要看一下過去幾年里,各類國際頂會和期刊上有多少關于FPGA循環(huán)展開與優(yōu)化的論文就可見一斑了。

  為了應對FPGA的設計復雜度過大的問題,業(yè)界通常有兩種方法:第一,盡量將優(yōu)化過的硬件設計封裝成IP,讓使用者直接調用。第二,使用諸如高層次綜合(HLS)的方法,直接將高層語言描述的模型轉化為FPGA硬件。

640.jpg

  HLS一直是FPGA業(yè)界發(fā)展的重要方向,幾乎沒有之一。老石在之前的文章《高層次綜合 – 解鎖FPGA廣闊應用的最后一塊拼圖》中曾經詳細分析過,這里不再贅述,有興趣的讀者可以參考那篇文章。

  HLS的主要問題是,它設計的初衷是為了硬件工程師服務,而非軟件和算法開發(fā)者。因此,起碼到目前為止,在業(yè)界取得成功的HLS工具都需要使用者有著豐富的硬件知識。在數(shù)字電路工程師手中,HLS工具已經被證明可以極大的縮短設計周期,有時甚至可以得到近似或優(yōu)于人工優(yōu)化過的RTL代碼。然而對于軟件工程師,HLS就好比讓C羅去湖人隊打籃球,固然噱頭十足,但很難得到令人滿意的成績。

  OneAPI在很大程度上可以看做是HLS的擴展,但它的主要目標受眾則是軟件和算法工程師,這也將成為OneAPI與其他HLS工具的最主要區(qū)別。OneAPI提供了一個統(tǒng)一的軟件編程接口,使得開發(fā)者可以隨意在底層硬件之間進行切換和優(yōu)化,而無需太多關心具體的電路結構和細節(jié)。

640.webp (10).jpg

  DPC++語言與硬件加速庫

  具體來說,OneAPI的核心是一個名為Data Parallel C++(DPC++)的編程語言。DPC++本質上是C++的擴展,增加了對SYCL的支持。

  SYCL由Khronos組織開發(fā),它是一個在OpenCL上的C++抽象層,使得用戶可以直接用簡潔的C++對GPU等進行開發(fā),而無需被OpenCL限制。

  不過,有關DPC++本身的資料目前還比較有限,尚不清楚其具體的開發(fā)方法、以及如何對異構系統(tǒng)進行編程。待具體實例出現(xiàn)后,老石再進行詳細解讀。

  除了編程接口外,OneAPI還會包含一個完整的開發(fā)環(huán)境、軟件庫、驅動程序、調試工具等要素,并且這些加速庫都已經針對底層硬件進行了優(yōu)化設計。

  這種基于優(yōu)化過的加速庫的設計,和賽靈思的Vitis系統(tǒng)有著異曲同工之妙,而這也恰恰代表了業(yè)界發(fā)展的方向?,F(xiàn)如今,生態(tài)為王,為了掌握生態(tài)和開發(fā)者,就必須盡可能多的提供各類開發(fā)庫和IP,以便開發(fā)者專注于應用開發(fā),而無需重復造輪子。

640.webp (9).jpg

  (圖片來自英特爾)

  為了支持SVMS四大類硬件架構,OneAPI實際上給自己設置了非常高的目標。英特爾已經在2019年四季度發(fā)布了OneAPI的開發(fā)者測試版。除了基本工開發(fā)工具包之外,英特爾還發(fā)布了針對高性能計算(HPC)、深度學習、IoT、以及視覺和視頻等四種領域專用的開發(fā)工具包,以期為這些特定的應用進行針對性的優(yōu)化。在當前的版本中,開發(fā)者仍然需要在SVMS四大類中手動指定目標器件類別。但除此之外,OneAPI就會自動對目標器件的子類別進行優(yōu)化。

  結語

  兵法云,兵馬未動,糧草先行。在技術進步日新月異的當代,各類AI芯片、硬件加速器不斷涌現(xiàn),異構計算已經成為整個行業(yè)最重要的趨勢。針對這些層出不窮的新硬件,則更應該“架構未動,軟件先行”。作為芯片廠商,單純提供芯片產品已經無法滿足市場和使用者的需要,只有同時提供硬件和軟件生態(tài),才能在激烈的競爭中殺出一席之地。

  老石認為,OneAPI是英特爾當前最具有戰(zhàn)略意義的生態(tài)布局。相信有了諸如OneAPI之類的高層設計工具,軟件工程師和算法專家們就能進一步釋放包括FPGA在內的異構系統(tǒng)的底層算力。至于OneAPI未來的表現(xiàn)如何,讓我們拭目以待。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。