《電子技術應用》
您所在的位置:首頁 > 測試測量 > 業(yè)界動態(tài) > 給機器人“造腦”:英偉達在AI芯片領域有多牛?

給機器人“造腦”:英偉達在AI芯片領域有多牛?

2018-06-24

  AI芯片之于人工智能的意義,則可以理解為發(fā)動機之于汽車。人工智能這一理論已經提出了多年,但是由于實現(xiàn)它需要的計算量實在太大,這輛“跑車”一直沒有配備上合適的“發(fā)動機”,只能放在倉庫積灰。直到AI算法和大數(shù)據(jù)時代的到來、以及AI芯片的出現(xiàn)。

1.jpg

  第三波AI浪潮的發(fā)展主要由深度學習技術的突破引領,而英偉達(Nvidia)憑借其通用的GPU單元,專門的TensorRT加速器,強勁的矩陣運算性能加上對其他算法的兼顧,英偉達不僅能用GPU滿足AI構建的訓練需求,還能用TeslaRT用來部署,很好實現(xiàn)AI構建,所以英偉達也率先成了這一波AI熱潮的最大受益者。

  近日,英偉達正式發(fā)布了一款全新AI芯片—Jetson Xavier,Jetson Xavier作NVIDIA Isaac平臺的核心,是全球首款專為機器人設計的計算機。該公司CEO黃仁勛在周一的新聞發(fā)布會上表示:“這臺小電腦,將成為未來機器人的大腦”。

2.jpg

  Jetson Xavier包含了六顆處理器,包括1個Volta Tensor Core GPU、1個8核ARM64 CPU、2個NVDLA深度學習加速器、1個圖像處理器、1個視覺處理器和1個視頻處理器,每秒可執(zhí)行30萬億次操作。為了打造它,Nvidia足足耗費了五年的時間——三年設計、兩年筑造,共有超過8000人參與了設計與開發(fā),可以說這是Nvidia單獨做過的最長的一個處理器項目。它的處理能力與配備了10萬美元GPU的工作站大致相同,但功率僅為30瓦。

  簡而言之,就是Nvidia成功地將1000瓦性能的10萬美元級工作站,縮小到了30瓦的‘掌中寶’的程度。

3.jpg

  NVIDIA為Jetson Xavier的模擬、訓練、驗證和部署提供了一個工具箱。該機器人軟件包含Isaac SDK、Isaac IMX、Isaac Sim三方面內容:

  l Isaac SDK:一套API和工具,可借助全面加速的庫,開發(fā)機器人算法軟件及運行時框架。

  l Isaac IMX:Isaac智能機器加速應用,是NVIDIA開發(fā)的機器人算法軟件的集合。

  l 當前Nvidia的技術,已經被一些企業(yè)用于自主倉庫機器人、機器采摘和農業(yè)機器人。不過黃仁勛表示,JetsonXavier要比之前的AI芯片要強大20倍。

  l Isaac Sim:高度逼真的虛擬仿真環(huán)境,可供開發(fā)者訓練自主機器,并使用Jetson Xavier進行硬件在環(huán)測試。

  提早轉型,英偉達開啟人工智能之路

  作為一家圖像處理芯片公司,Nvidia約在7年前就已經開始轉型布局人工智能。當時人工智能概念還未興起,AI仍是一片藍海。經過持續(xù)多年的研發(fā),公司在近年來陸續(xù)推出人工智能芯片、系統(tǒng)、軟件和服務,打造世界頂級人工智能公司。

4.jpg

  2009年 英偉達Tegra進入奧迪汽車

  德國大眾為旗下的奧迪汽車引入新式導航系統(tǒng),并首次采用NVIDIATegra片上系統(tǒng)處理器。相比于2009年初的多媒體交互系統(tǒng)(MMI),新的Tegra核心導航系統(tǒng)自然要更加高級,不但功能上更強大,效果也應該更酷一些。

  在后來的GTC 2014大會上,奧迪自動駕駛汽車再次展示了基于Tegra K1開發(fā)套件的車載智能系統(tǒng),可提供自動駕駛、導航、碰撞感應、智能鏈接等功能。

  2013年11月 IBM和英偉達聯(lián)合開發(fā)超級計算機

  IBM與芯片廠商英偉達Nvidia達成戰(zhàn)略合作,共同設計開發(fā)新型超級計算機系統(tǒng)和服務器。英偉達開發(fā)的圖形處理單元芯片(GPU),很好適用于浮點計算,表現(xiàn)勝于英特爾的傳統(tǒng)CPU Xeon和AMD的Opteron。排名第二位的“泰坦”也搭載了GPU。

  根據(jù)IBM和英偉達合作內容,雙方在芯片方面就行合作,通過技術共享,讓英偉達的Tesla GPU更好與前者的Power 8芯片協(xié)同工作。

  早期的Tesla車型曾使用過Tegra 2,但處理能力遠遠不夠,所以后來升級到了Tegra 3。特斯拉Model S電動車的車載娛樂系統(tǒng)也是基于Tegra 3設計。Nvidia基于在圖形處理方面長期積累與CUDA架構,和特斯拉建立密切的合作。而特斯拉為Nvidia在高度智能化的汽車上的布局上起到助推作用。

  2014年早期特斯拉ModelS搭載英偉達Tegra 3

  Nvidia不僅在硬件上有布局,同時已經滲透到了軟件層面。Nvidia將一輛Jeep進行深度改裝,但改的不是發(fā)動機、輪轂或包圍,而是中控系統(tǒng)。改裝后的Jeep采用3D打印制造出的中控臺,搭配一個17英寸的電容屏。屏幕劃分為3個區(qū)域,上中下分貝顯示地圖、娛樂信息以及HVAC(比如空調控制)。配合Tegra K1,Nvidia直接切入到了車輛的CAN總線中,實現(xiàn)了對整個車輛的控制。

  2014年初,世界上采用NVIDIA處理器的汽車已經超過450萬輛,涉及20多個品牌、100多款車型,其中包括奧迪、寶馬、大眾等車企巨頭,也包括特斯拉這種車界新貴。2015年,Tegra芯片在汽車領域發(fā)展加快,在道路上跑的汽車有超過800萬輛搭載Tegra芯片。2015年第三季度Nvidia在汽車領域的業(yè)務銷量增長了51%。

  2015年12月 Facebook開源BigSur

  Facebook研發(fā)代號為“BigSur”的新一代硬件的設計目標是訓練神經網絡。除人工智能外,這一技術還經常被稱作機器或深度學習。Facebook與Nvidia進行合作,是第一家采用英偉達TeslaM40GPU加速器的廠商。M40GPU面向深度神經網絡,是BigSur平臺和OpenRack兼容硬件的關鍵。

  采用M40的BigSur平臺的速度是該Facebook上一代產品的2倍,使得訓練規(guī)模相當于原來2倍的神經網絡的速度提高1倍。BigSur是第一款針對機器學習、人工智能研究開發(fā)的開放源代碼計算系統(tǒng),F(xiàn)acebook將把設計材料提交給開放計算項目。

  2016年 新款特斯拉model S采用Tegrak1

  2016年新款狀態(tài)顯示器分辨率升級,從過去的1280x480 升級到1920x720,因此副處理器也從Tegra 2升級為Tegra 3,主處理器從Tegra 3升級到了Tegra k1 從而更好地支持自動輔助駕駛功能。

  Tesla P40、Tesla P4高性能計算卡

  2016年9月,NVIDIA發(fā)布新一代高性能計算卡Tesla P40、Tesla P4,它們倆將取代上代麥克斯韋架構的Tesla M40/M4,進化到最新的帕斯卡架構,擁有16nm工藝。這兩款計算卡主要負責圖像、文字和語音識別,專為人工智能、深度學習、神經網絡推演而生。

  Tesla P4及P40特別針對推論設計,使用經訓練的深度神經網絡識別語音、影像及文字以回應使用者和裝置要求。Pascal架構GPU具備以8位(INT8)運算為主的專門推論指令,提供比CPU快45倍的反應速度,與不到一年前推出的GPU解決方案相比則提升了4倍。

  深度學習超級計算機NVIDIADGX-1

  深度學習最苛刻的部分是訓練。NVIDIA專為深度學習設計的PASCAL架構,助推深度學習加速高達65倍,并且能夠支持每個主要的深度學習框架。在此架構基礎上,NVIDIA創(chuàng)造了專為GPU深度學習所設計的超級計算機DGX1。

  NVIDIA的DGX-1基于Tesla P100加速卡(研發(fā)費用高達20億美元)是世界上首款專為深度學習而打造的系統(tǒng),具備全面集成的硬件和軟件,可以輕松快速地完成部署。NVIDIADGX-1革命性的性能可大幅加快訓練速度,成為世界上首款體積小性能強(單機箱)的深度學習超級計算機。

  協(xié)同駕駛AI Co-Pilot

  XAVIER已經被英偉達安裝在一輛基于林肯MKC所打造的自動駕駛測試車BB8上,另外,英偉達還將在自動駕駛領域同奧迪展開合作,其全自動駕駛汽車預計將在2020年上路。

  AI Co-Pilot(人工智能協(xié)同駕駛)系統(tǒng)該系統(tǒng)具有人臉識別、頭部追蹤、視線追蹤等功能,能在行車中輔助駕駛者,提高駕駛安全性與便利性。AI Co-Pilot還能在復雜的噪聲環(huán)境中通過讀唇獲知駕駛者的需求,準確率已達93.4%。

  英偉達的優(yōu)勢真的是無人能擋嗎?

  英偉達上周發(fā)布的第一季財報再次超出業(yè)界預期,財報顯示這一季度總收入增長了66%,其中數(shù)據(jù)中心業(yè)務營收增長71%達到7.01億美元。英偉達的數(shù)據(jù)中心業(yè)務包含HPC(高性能計算)、數(shù)據(jù)中心GPU以及AI加速器即使相比過去幾年2-3倍的增長率要少很多,但極具潛力的AI芯片市場空間依舊吸引了眾多巨頭和創(chuàng)業(yè)者的參與。

  不過英偉達現(xiàn)在具有優(yōu)勢并不意味著AI市場的蛋糕會被英偉達獨吞,無論是科技巨頭英特爾、谷歌、IBM、AMD還是OURS、地平線、寒武紀等初創(chuàng)企業(yè)都紛紛加入了AI芯片領域的競爭。

  英特爾這幾年也是卯足了勁入軍AI市場,英特爾的All in AI實力也是不容小覷。除了鞏固資深的優(yōu)勢產品以外,還進行了一系列的收購以增強自己的能力。英特爾針對已有的優(yōu)勢產品XeonPhi加速計算卡、收購的Altera FPGA、 Nervana System幾大產品線進行深度學習的優(yōu)化,從AI構建的訓練和部署都能夠看出這均與英偉達形成競爭,在自動駕駛應用場景中也通過收購Mobileye與英偉達形成強競爭關系。同時還基于FPGA打造自己在AI領域的特色,對人工智能初創(chuàng)芯片企業(yè)的持續(xù)投資也有助于英特爾在AI芯片領域實現(xiàn)后來居上。

5.jpg

  除了英特爾All In AI全面叫板英偉達,眾多初創(chuàng)公司也會成為挑戰(zhàn)英偉達不可忽視的對手。

  以2017年由兩位華人在美國硅谷創(chuàng)立的OURS為代表,OURS以低功耗端計算AI芯片為核心技術,目標是解決工業(yè)/商業(yè)、機器人、汽車自動駕駛、安防等領域的3D機器視覺和多傳感器融合的問題。OURS的核心技術之一就是硅光技術,這一技術很適合于計算機內部和多核之間的大規(guī)模通信,其最大的優(yōu)勢在于擁有相當高的傳輸速率,可使處理器內核之間的數(shù)據(jù)傳輸速度比目前快 100 倍甚至更高。OURS 采用的是以數(shù)據(jù)為中心的RISC-V 計算機指令集架構,這也是OURS的另一大核心優(yōu)勢。

  寒武紀近日也發(fā)布了一款云端智能芯片Cambricon MLU100,詞云端芯片也延續(xù)了寒武紀產品通用性的特點,支持各類深度學習和經典機器學習算法,滿足視覺、語音、自然語言處理、經典數(shù)據(jù)挖掘等領域復雜場景下(如大數(shù)據(jù)量、多任務、多模態(tài)、低延時、高通量)的云端智能處理需求。

  不只是硬件,寒武紀還努力實現(xiàn)軟硬件的協(xié)同工作,寒武紀從 2016 年起逐步推出了寒武紀 NeuWare 軟件工具鏈,該平臺終端和云端產品均支持,可以實現(xiàn)對 tensorflow、caffe 和 mxnet 的 API 兼容,同時提供寒武紀專門的高性庫,可以方便地進行智能應用的開發(fā),遷移和調優(yōu)。

6.jpg

  小結:

  AI芯片全球起步時間幾乎同步,此時,人工智能領域尚未出現(xiàn)“獨步天下”的國際巨頭。但是也要警惕“全民造芯”虛火,目前還沒有出現(xiàn)像CPU(中央處理器)一樣的AI通用算法芯片,AI的殺手級應用還沒出現(xiàn),未來這個產業(yè)還有很長一段路要走。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。