人工智能是什么?
它是技術(shù)還是應(yīng)用,我們怎么樣才能實(shí)現(xiàn)科幻電影中營造的人工智能世界?
當(dāng)夢想照進(jìn)現(xiàn)實(shí),一步步的從理論成為實(shí)際,這中間有太多的路要走,每個人,每個企業(yè)對于同一技術(shù)的思考都不盡相同。
但是,所謂大道至簡,條條大路通羅馬,殊途同歸,說的都是一個道理。
人工智能半導(dǎo)體,從軟到硬
人工智能,作為一項(xiàng)應(yīng)用,正在重復(fù)過去數(shù)十年個人計(jì)算機(jī)走過的老路。
從硬件,軟件,再到硬件的發(fā)展,就像天平的兩端,需要在兩者之間找到最佳的平衡點(diǎn),才能夠?qū)崿F(xiàn)技術(shù)和應(yīng)用的落地。
在蘋果,谷歌,微軟在軟件基礎(chǔ)之上打磨人工智能功能之后,這些企業(yè)也意識到了硬件的重要性,谷歌甚至專門為人工智能開發(fā)了其特有的專用芯片TPU,這也說明,人工智能芯片對于整個產(chǎn)業(yè)來說,正在變得至關(guān)重要。
在美國是這樣,在韓國也是如此。
根據(jù)美國知識產(chǎn)權(quán)局表示,2017 年 AI 半導(dǎo)體專利達(dá) 391 件,對比 2013 年的 32 件,近 4 年成長超過 10 倍,且速度逐年加快,2014 年有 59 件、2015 年成長三成至 77 件,2016 年更是倍增至 167 件。
而在中國,在人工智能的浪潮中,有這樣一群人,他們畢業(yè)于國內(nèi)外的頂級高效,對人工智能有著深刻的認(rèn)識,大多數(shù)曾供職于國內(nèi)外的頂級研究室,或在高校任職,現(xiàn)在,都投身于人工智能的浪潮從,以各自對于人工智能硬件的認(rèn)知,推動人工智能半導(dǎo)體方面的發(fā)展。
其中,尤以地平線機(jī)器人,深鑒科技和寒武紀(jì)這三家企業(yè)被業(yè)內(nèi)提到的次數(shù)最多,也最為人津津樂道。
那么這三家企業(yè)在實(shí)現(xiàn)人工智能的大道上,到底有什么區(qū)別呢?
在3月15日舉行的AI半導(dǎo)體技術(shù)論壇上,這樣一個以打假著稱的日子里,我們看一看這三家企業(yè)有何不同吧。
以下敘述,沒有排名,僅以演講順序?yàn)橹鳌?/p>
地平線機(jī)器人:嵌入式人工智能
一家企業(yè)能否成功主要取決于幾個方面,能否把握市場趨勢,能否推出具有優(yōu)勢的產(chǎn)品,能否不隨波逐流,有自己的思路。
按照地平線機(jī)器人芯片規(guī)劃部部長譚洪賀的話來說,成立于2015年的地平線,從成立之初就對人工智能芯片的設(shè)計(jì)有著自己獨(dú)特的想法。
適用于IT領(lǐng)域的安迪比爾定理: “Andy gives, Bill takes away.(安迪提供什么,比爾拿走什么。)” ,在地平線看來也適用于人工智能芯片市場。
摩爾定理給所有的計(jì)算機(jī)消費(fèi)者帶來一個希望,如果我今天嫌計(jì)算機(jī)太貴買不起,那么我等十八個月就可以用一半的價錢來買。要真是這樣簡單的話,計(jì)算機(jī)的銷售量就上不去了。需要買計(jì)算機(jī)的人會多等幾個月,已經(jīng)有計(jì)算機(jī)的人也沒有動力更新計(jì)算機(jī)。
這一定理說明了硬件和算法之間的問題,也確定了地平線在人工智能芯片上的發(fā)展方向。
由于有了足夠的硬件資源,工程師做事情更講究自己的工作效率,程序的規(guī)范化和可讀性等等。另外,由于人工成本的提高,為了節(jié)省工程師的時間,算法更迭會越來越快,同時效率卻越來越低。今天的比昨天的占用硬件資源多是一件在所難免的事。
這就像“缸”與“水”的關(guān)系一樣,芯片是外在的缸,算法是水,想要實(shí)現(xiàn)更多的人工智能的功能,就需要更多,更多功能的算法,也就要求必須要有足夠大的缸來裝下這些算法,缸比水大,頂多算是資源過剩,水比缸大,在芯片上可就不單是簡簡單單的溢出問題了。
因此,譚洪賀表示,地平線在設(shè)計(jì)芯片的時候,都是將算法和芯片作為一個整體來考慮,協(xié)同進(jìn)行設(shè)計(jì)。
這一想法的結(jié)果就是,2017年12月20號,地平線在北京舉辦了一場名為“AI芯時代”的產(chǎn)品發(fā)布會。
地平線帶來了全新的嵌入式人工智能視覺處理器:面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。
按照地平線創(chuàng)始人&CEO余凱的話來說,這是完全由地平線自主研發(fā)的人工智能芯片,采用地平線的第一代BPU架構(gòu),具有全球領(lǐng)先的性能:可實(shí)時處理 1080p30視頻,每幀中可同時對200個目標(biāo)進(jìn)行檢測、跟蹤、識別,典型功耗1.5W,每幀延時小于30ms。
據(jù)公開資料顯示,余凱是前百度IDL副院長,百度無人駕駛項(xiàng)目發(fā)起人之一。這個名字體現(xiàn)了地平線公司對超越邊界的執(zhí)著。公司從創(chuàng)立伊始就以打造中國的Neural Processing Unit (NPU)為目標(biāo)。希望通過研發(fā)高性能、低功耗、低成本的處理器和算法軟件,解決終端設(shè)備在本地的算法和計(jì)算問題,成為嵌入式人工智能的領(lǐng)導(dǎo)者。為了實(shí)現(xiàn)這個目標(biāo),他們自主研發(fā)了一種創(chuàng)新的嵌入式人工智能處理器架構(gòu)IP——Brain Processing Unit,也就是我們所說的BPU。
“從本質(zhì)上來說,地平線既不單純是一家算法公司或者是一家芯片公司。作為一家嵌入式人工智能解決方案公司,地平線的目標(biāo)是要做全球的嵌入式人工智能的領(lǐng)導(dǎo)者。做AI的大腦,提供高性能,高能效,全站式的解決方案?!?/p>
芯片結(jié)構(gòu)的不停迭代告訴我們,CPU屬于標(biāo)量處理器,GPU是向量處理器,從谷歌的TPU和地平線的BPU開始,已經(jīng)演變成張量的處理器,因此所有的模塊都屬于張量處理的模塊。要求在存儲和數(shù)據(jù)處理的過程中,注意尺度的問題。對于張量處理器來說,無論是二維還是三維,都需要確定主攻的方向。
地平線對于人工智能的看法分為三個步驟,第一,是做能夠感知的AI,也就是能夠感知周圍的世界。第二步建模,以實(shí)現(xiàn)對周圍環(huán)境進(jìn)行3D建模或者是結(jié)構(gòu)建模。最后實(shí)現(xiàn)決策和規(guī)劃,再基于感知和建模的結(jié)果,反饋到現(xiàn)實(shí)之中。
寒武紀(jì):人工智能芯片的多樣化挑戰(zhàn)
與地平線2015年入局不同,寒武紀(jì)可以說算是國內(nèi)最早一批的人工智能公司之一。
資料記載,寒武紀(jì)的起源可以追溯至2008年,其前身為中科院計(jì)算所成立的一只10人學(xué)術(shù)團(tuán)隊(duì)。
估計(jì)當(dāng)時的這10個人都沒有想到會成立一家公司,更能夠推出芯片,攪動中國人工智能市場。
事實(shí)往往就是這么出乎意料,早期以發(fā)表學(xué)術(shù)論文為主的這一只團(tuán)隊(duì),在2015年研制出了首個處理器產(chǎn)品,并逐漸開始商業(yè)化。
但是,一個巨大的問題擺在了這個團(tuán)隊(duì)面前,沒有公司,商業(yè)化運(yùn)營很難進(jìn)行下去,因此,2016年3月,寒武紀(jì)公司正式成立。
在中國科學(xué)院計(jì)算技術(shù)研究所陳云霽、陳天石兩兄弟的領(lǐng)導(dǎo)下,2016年,寒武紀(jì)推出的寒武紀(jì)1A處理器(Cambricon-1A)是世界首款商用深度學(xué)習(xí)專用處理器,面向智能手機(jī)、安防監(jiān)控、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備。
按照寒武紀(jì)執(zhí)行董事羅韜話來說,在中國提供人工智能芯片的企業(yè)中,寒武紀(jì)解決方案最為完整。目前,寒武紀(jì)已與通信設(shè)備商華為合作,在后者智能手機(jī)Mate 10搭載的麒麟970芯片集成了1A的IP(知識產(chǎn)權(quán)),并與IT設(shè)備商中科曙光推出了面向人工智能推理任務(wù)的服務(wù)器Phaneron。
陳云霽曾這樣說到:“人的大腦是已知最智能的物體。如果能把大腦中神經(jīng)元和突觸數(shù)字化抽象出來,這樣的數(shù)字化網(wǎng)絡(luò)某種程度上可能就繼承了人腦對信息的處理能力。”
從現(xiàn)有情況來看,一方面神經(jīng)網(wǎng)絡(luò)確實(shí)是智能處理的好方法,但另一方面通用處理器在這方面效率很低,為什么不能用人工智能的辦法來設(shè)計(jì)一款專門的芯片呢?所以,“寒武紀(jì)”芯片就是要解決這個專門的問題。
“寒武紀(jì)”AI芯片可以在計(jì)算機(jī)中模擬神經(jīng)元和突觸的計(jì)算,對信息進(jìn)行智能處理。通過設(shè)計(jì)專門存儲結(jié)構(gòu)和指令集,每秒可以處理160億個神經(jīng)元和超過2萬億個突觸,功耗卻只有原來的1/10。
按照寒武紀(jì)目前的想法來看,人工智能芯片面臨的就是多樣化問題,這個多樣化,包括兩個方面:需求多樣化和形態(tài)多樣化。
需求多樣化是指,對于不同的神經(jīng)網(wǎng)絡(luò)來說,就想吃飯一樣,不同的人口味都不同,有的人喜歡甜的,有的人喜歡咸的。應(yīng)用在不用領(lǐng)域的神經(jīng)網(wǎng)絡(luò),基于不同的功能,不同的需求,要求也不盡相同。大規(guī)模的神經(jīng)網(wǎng)絡(luò)需要高性能,高效化的芯片。小規(guī)模的神經(jīng)網(wǎng)絡(luò)需要低能耗的芯片。
而形態(tài)多樣化,則是指對于同一款神經(jīng)網(wǎng)絡(luò)芯片,想要能夠支持多種形態(tài)的神經(jīng)網(wǎng)絡(luò),不僅要在結(jié)構(gòu)上,也要在算法等諸多方面做出全面的考慮,才能夠滿足多個神經(jīng)網(wǎng)絡(luò)的需求。
深鑒科技:軟硬件協(xié)同
深鑒科技的團(tuán)隊(duì)真可謂是“全明星陣容”,其創(chuàng)始團(tuán)隊(duì)全部是由來自斯坦福大學(xué)與清華大學(xué)的深度學(xué)習(xí)硬件加速研究者組建而成。其中,聯(lián)合創(chuàng)始人&CTO單羿作為前百度前百度IDL異構(gòu)計(jì)算方向創(chuàng)始成員,曾入選過IBM PhD Fellowship(IBM博士英才計(jì)劃)項(xiàng)目。
聯(lián)合創(chuàng)始人韓松在2016年世界頂級深度學(xué)習(xí)會議ICLR上,以一篇Deep Compression(深度神經(jīng)網(wǎng)絡(luò)壓縮)論文與AlphaGo的開發(fā)者——谷歌DeepMind共同活動了最佳論文獎,同時因?yàn)槠浜芨叩难芯吭煸?,韓松將于2018年任職MIT(麻省理工)助理教授。
另一位聯(lián)合創(chuàng)人汪玉是清華電子系副教授,國家自然科學(xué)基金“優(yōu)青”獲得者,清華大學(xué)教改以來首批終身教授,汪玉從2006年就已經(jīng)開始研究FPGA,并且是現(xiàn)任ACM FPGA技術(shù)委員會亞太地區(qū)唯一成員。
所以,雖然深鑒科技在2016年才成立,但是已經(jīng)吸引了來自百度、360、華為、風(fēng)河、Intel、Nokia等公司在內(nèi)的大批行業(yè)精英,使得整個團(tuán)隊(duì)在具有國際學(xué)術(shù)影響力的同時又具備了資深的工業(yè)經(jīng)驗(yàn)。
資料顯示,深鑒科技最為核心的即Deep Learning Processing Unit(DPU)及神經(jīng)網(wǎng)絡(luò)壓縮編譯技術(shù),甚至被世界最大的FPGA芯片廠商Xilinx認(rèn)為是世界深度學(xué)習(xí)硬件加速的典范。
所謂DPU既深度學(xué)習(xí)處理器,其精髓就在于使用了深度壓縮技術(shù)。這項(xiàng)技術(shù)不僅可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響精度,還可以使用芯片存儲深度學(xué)習(xí)算法模型,減少內(nèi)存讀取次數(shù),大大降低運(yùn)行功耗。
與此同時,基于優(yōu)化協(xié)同性,深度壓縮技術(shù)對于硬件本身也提出了新的要求。為此,深鑒科技推出了兩種用于深度學(xué)習(xí)處理器的底層架構(gòu)——亞里士多德架構(gòu)和笛卡爾架構(gòu),以及面向DPU的深度神經(jīng)網(wǎng)絡(luò)開發(fā)工具包DNNDK。
姚頌認(rèn)為,所有產(chǎn)品都可以分為四個層次:能用、好用、讓用戶想用、讓用戶愛用——AI芯片產(chǎn)品也是如此。
對于AI芯片來說:
第一層是能用,就是這塊芯片能夠跑AI、能夠?qū)ι疃葘W(xué)習(xí)運(yùn)算進(jìn)行加速。
第二層是好用,如何讓這塊芯片支持的AI算法種類多一點(diǎn),讓用戶開發(fā)起來更簡單。
第三層是想用,那就是用戶用你的產(chǎn)品開發(fā)起來更簡單、算法跑出來性能更好,選擇別的產(chǎn)品時開發(fā)起來更麻煩。
第四層則是愛用,也就是用戶粘性高,當(dāng)很多使用你的芯片的人集成在一起,形成社區(qū)與軟件生態(tài),有很多開放的項(xiàng)目代碼可以供人交流參考,這就不僅是能用或者好用了,而是讓用戶愛用。
人工智能的兩個方向
近年來,英特爾、英偉達(dá)、Facebook、微軟、Google、IBM、蘋果、華為等科技公司都在積極布局AI芯片,復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò)計(jì)算需求很高,除了云計(jì)算,需要有更多更強(qiáng)大的本地計(jì)算資源。
咨詢公司Tractica的預(yù)測數(shù)據(jù)顯示,到2025年,與人工智能相關(guān)的深度學(xué)習(xí)芯片組市場收入,將由去年的5億美元飆升至122億美元的規(guī)模,復(fù)合年均增長率超過40%。這一數(shù)據(jù)不僅是基于巨頭的參與,也是源自人工智能創(chuàng)業(yè)企業(yè)近年來的爆發(fā)。
要知道,從1956人工智能概念被提出以來,經(jīng)歷60多年的發(fā)展,這項(xiàng)技術(shù)前后經(jīng)歷了多次跌宕起伏。隨著AlphaGo打敗李世石這樣的典型案例出現(xiàn),無論是各國政府還是資本市場,都將人工智能視為今后發(fā)展的戰(zhàn)略中心。
我國更是提出了要將人工智能與傳統(tǒng)行業(yè)進(jìn)行深度融合,這為一大批企業(yè)提供了極好的發(fā)展空間。更為重要的是,“大眾創(chuàng)業(yè)萬眾創(chuàng)新”的新時代也為廣大創(chuàng)業(yè)者提供了良好的發(fā)展平臺。
在這波人工智能的創(chuàng)業(yè)浪潮中,有兩個創(chuàng)業(yè)方向:1、以算法為主,做算法研究 ;2、以硬件為主,做AI芯片。
總結(jié)
在這場硝煙尚未完全燃起的戰(zhàn)爭中,美國一直以來是全球人工智能領(lǐng)域領(lǐng)跑的國家,但中國已經(jīng)開始著手加速入局。這兩年,數(shù)家中國公司開始芯片研發(fā),“XPU”的出現(xiàn)如雨后春筍。
而以地平線,寒武紀(jì),深鑒科技為主的大批人工智能芯片企業(yè)正在以各自對于人工智能行業(yè)的獨(dú)特思考,不斷的摸索自己的發(fā)展之路,創(chuàng)造屬于自己的人工智能領(lǐng)域。
地平線的發(fā)展策略是,針對使用場景需求研究最適合的算法框架,然后將算法框架實(shí)現(xiàn)在芯片上,其目的是做“嵌入式人工智能”,用芯片加算法的模式,進(jìn)行單點(diǎn)突破。
寒武紀(jì)則選擇了另一條路徑。2016年發(fā)布了人工智能專用指令集后,寒武紀(jì)在軟件平臺投入了大量的人力。寒武紀(jì)不僅令處理器可以支持主流的編程框架,同時開發(fā)了專用函數(shù)庫、編譯器、模型生成工具等,降低開發(fā)者使用的門檻。相對而言,寒武紀(jì)的芯片通用性更強(qiáng)。
而深鑒科技走的是為深度學(xué)習(xí)提供高效靈活的軟硬一體解決方案的道路。無論是推出Deep Learning Processing Unit(DPU)還是神經(jīng)網(wǎng)絡(luò)壓縮編譯技術(shù),深鑒科技始終認(rèn)為,每家AI芯片公司都需要成為一家軟件&系統(tǒng)公司,這樣才能在市場競爭中取得優(yōu)勢。