人工智能是什么?
它是技術(shù)還是應用,我們怎么樣才能實現(xiàn)科幻電影中營造的人工智能世界?
當夢想照進現(xiàn)實,一步步的從理論成為實際,這中間有太多的路要走,每個人,每個企業(yè)對于同一技術(shù)的思考都不盡相同。
但是,所謂大道至簡,條條大路通羅馬,殊途同歸,說的都是一個道理。
人工智能半導體,從軟到硬
人工智能,作為一項應用,正在重復過去數(shù)十年個人計算機走過的老路。
從硬件,軟件,再到硬件的發(fā)展,就像天平的兩端,需要在兩者之間找到最佳的平衡點,才能夠?qū)崿F(xiàn)技術(shù)和應用的落地。
在蘋果,谷歌,微軟在軟件基礎(chǔ)之上打磨人工智能功能之后,這些企業(yè)也意識到了硬件的重要性,谷歌甚至專門為人工智能開發(fā)了其特有的專用芯片TPU,這也說明,人工智能芯片對于整個產(chǎn)業(yè)來說,正在變得至關(guān)重要。
在美國是這樣,在韓國也是如此。
根據(jù)美國知識產(chǎn)權(quán)局表示,2017 年 AI 半導體專利達 391 件,對比 2013 年的 32 件,近 4 年成長超過 10 倍,且速度逐年加快,2014 年有 59 件、2015 年成長三成至 77 件,2016 年更是倍增至 167 件。
而在中國,在人工智能的浪潮中,有這樣一群人,他們畢業(yè)于國內(nèi)外的頂級高效,對人工智能有著深刻的認識,大多數(shù)曾供職于國內(nèi)外的頂級研究室,或在高校任職,現(xiàn)在,都投身于人工智能的浪潮從,以各自對于人工智能硬件的認知,推動人工智能半導體方面的發(fā)展。
其中,尤以地平線機器人,深鑒科技和寒武紀這三家企業(yè)被業(yè)內(nèi)提到的次數(shù)最多,也最為人津津樂道。
那么這三家企業(yè)在實現(xiàn)人工智能的大道上,到底有什么區(qū)別呢?
在3月15日舉行的AI半導體技術(shù)論壇上,這樣一個以打假著稱的日子里,我們看一看這三家企業(yè)有何不同吧。
以下敘述,沒有排名,僅以演講順序為主。
地平線機器人:嵌入式人工智能
一家企業(yè)能否成功主要取決于幾個方面,能否把握市場趨勢,能否推出具有優(yōu)勢的產(chǎn)品,能否不隨波逐流,有自己的思路。
按照地平線機器人芯片規(guī)劃部部長譚洪賀的話來說,成立于2015年的地平線,從成立之初就對人工智能芯片的設計有著自己獨特的想法。
適用于IT領(lǐng)域的安迪比爾定理: “Andy gives, Bill takes away.(安迪提供什么,比爾拿走什么。)” ,在地平線看來也適用于人工智能芯片市場。
摩爾定理給所有的計算機消費者帶來一個希望,如果我今天嫌計算機太貴買不起,那么我等十八個月就可以用一半的價錢來買。要真是這樣簡單的話,計算機的銷售量就上不去了。需要買計算機的人會多等幾個月,已經(jīng)有計算機的人也沒有動力更新計算機。
這一定理說明了硬件和算法之間的問題,也確定了地平線在人工智能芯片上的發(fā)展方向。
由于有了足夠的硬件資源,工程師做事情更講究自己的工作效率,程序的規(guī)范化和可讀性等等。另外,由于人工成本的提高,為了節(jié)省工程師的時間,算法更迭會越來越快,同時效率卻越來越低。今天的比昨天的占用硬件資源多是一件在所難免的事。
這就像“缸”與“水”的關(guān)系一樣,芯片是外在的缸,算法是水,想要實現(xiàn)更多的人工智能的功能,就需要更多,更多功能的算法,也就要求必須要有足夠大的缸來裝下這些算法,缸比水大,頂多算是資源過剩,水比缸大,在芯片上可就不單是簡簡單單的溢出問題了。
因此,譚洪賀表示,地平線在設計芯片的時候,都是將算法和芯片作為一個整體來考慮,協(xié)同進行設計。
這一想法的結(jié)果就是,2017年12月20號,地平線在北京舉辦了一場名為“AI芯時代”的產(chǎn)品發(fā)布會。
地平線帶來了全新的嵌入式人工智能視覺處理器:面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。
按照地平線創(chuàng)始人&CEO余凱的話來說,這是完全由地平線自主研發(fā)的人工智能芯片,采用地平線的第一代BPU架構(gòu),具有全球領(lǐng)先的性能:可實時處理 1080p30視頻,每幀中可同時對200個目標進行檢測、跟蹤、識別,典型功耗1.5W,每幀延時小于30ms。
據(jù)公開資料顯示,余凱是前百度IDL副院長,百度無人駕駛項目發(fā)起人之一。這個名字體現(xiàn)了地平線公司對超越邊界的執(zhí)著。公司從創(chuàng)立伊始就以打造中國的Neural Processing Unit (NPU)為目標。希望通過研發(fā)高性能、低功耗、低成本的處理器和算法軟件,解決終端設備在本地的算法和計算問題,成為嵌入式人工智能的領(lǐng)導者。為了實現(xiàn)這個目標,他們自主研發(fā)了一種創(chuàng)新的嵌入式人工智能處理器架構(gòu)IP——Brain Processing Unit,也就是我們所說的BPU。
“從本質(zhì)上來說,地平線既不單純是一家算法公司或者是一家芯片公司。作為一家嵌入式人工智能解決方案公司,地平線的目標是要做全球的嵌入式人工智能的領(lǐng)導者。做AI的大腦,提供高性能,高能效,全站式的解決方案。”
芯片結(jié)構(gòu)的不停迭代告訴我們,CPU屬于標量處理器,GPU是向量處理器,從谷歌的TPU和地平線的BPU開始,已經(jīng)演變成張量的處理器,因此所有的模塊都屬于張量處理的模塊。要求在存儲和數(shù)據(jù)處理的過程中,注意尺度的問題。對于張量處理器來說,無論是二維還是三維,都需要確定主攻的方向。
地平線對于人工智能的看法分為三個步驟,第一,是做能夠感知的AI,也就是能夠感知周圍的世界。第二步建模,以實現(xiàn)對周圍環(huán)境進行3D建模或者是結(jié)構(gòu)建模。最后實現(xiàn)決策和規(guī)劃,再基于感知和建模的結(jié)果,反饋到現(xiàn)實之中。
寒武紀:人工智能芯片的多樣化挑戰(zhàn)
與地平線2015年入局不同,寒武紀可以說算是國內(nèi)最早一批的人工智能公司之一。
資料記載,寒武紀的起源可以追溯至2008年,其前身為中科院計算所成立的一只10人學術(shù)團隊。
估計當時的這10個人都沒有想到會成立一家公司,更能夠推出芯片,攪動中國人工智能市場。
事實往往就是這么出乎意料,早期以發(fā)表學術(shù)論文為主的這一只團隊,在2015年研制出了首個處理器產(chǎn)品,并逐漸開始商業(yè)化。
但是,一個巨大的問題擺在了這個團隊面前,沒有公司,商業(yè)化運營很難進行下去,因此,2016年3月,寒武紀公司正式成立。
在中國科學院計算技術(shù)研究所陳云霽、陳天石兩兄弟的領(lǐng)導下,2016年,寒武紀推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,面向智能手機、安防監(jiān)控、可穿戴設備、無人機和智能駕駛等各類終端設備。
按照寒武紀執(zhí)行董事羅韜話來說,在中國提供人工智能芯片的企業(yè)中,寒武紀解決方案最為完整。目前,寒武紀已與通信設備商華為合作,在后者智能手機Mate 10搭載的麒麟970芯片集成了1A的IP(知識產(chǎn)權(quán)),并與IT設備商中科曙光推出了面向人工智能推理任務的服務器Phaneron。
陳云霽曾這樣說到:“人的大腦是已知最智能的物體。如果能把大腦中神經(jīng)元和突觸數(shù)字化抽象出來,這樣的數(shù)字化網(wǎng)絡某種程度上可能就繼承了人腦對信息的處理能力?!?/p>
從現(xiàn)有情況來看,一方面神經(jīng)網(wǎng)絡確實是智能處理的好方法,但另一方面通用處理器在這方面效率很低,為什么不能用人工智能的辦法來設計一款專門的芯片呢?所以,“寒武紀”芯片就是要解決這個專門的問題。
“寒武紀”AI芯片可以在計算機中模擬神經(jīng)元和突觸的計算,對信息進行智能處理。通過設計專門存儲結(jié)構(gòu)和指令集,每秒可以處理160億個神經(jīng)元和超過2萬億個突觸,功耗卻只有原來的1/10。
按照寒武紀目前的想法來看,人工智能芯片面臨的就是多樣化問題,這個多樣化,包括兩個方面:需求多樣化和形態(tài)多樣化。
需求多樣化是指,對于不同的神經(jīng)網(wǎng)絡來說,就想吃飯一樣,不同的人口味都不同,有的人喜歡甜的,有的人喜歡咸的。應用在不用領(lǐng)域的神經(jīng)網(wǎng)絡,基于不同的功能,不同的需求,要求也不盡相同。大規(guī)模的神經(jīng)網(wǎng)絡需要高性能,高效化的芯片。小規(guī)模的神經(jīng)網(wǎng)絡需要低能耗的芯片。
而形態(tài)多樣化,則是指對于同一款神經(jīng)網(wǎng)絡芯片,想要能夠支持多種形態(tài)的神經(jīng)網(wǎng)絡,不僅要在結(jié)構(gòu)上,也要在算法等諸多方面做出全面的考慮,才能夠滿足多個神經(jīng)網(wǎng)絡的需求。
深鑒科技:軟硬件協(xié)同
深鑒科技的團隊真可謂是“全明星陣容”,其創(chuàng)始團隊全部是由來自斯坦福大學與清華大學的深度學習硬件加速研究者組建而成。其中,聯(lián)合創(chuàng)始人&CTO單羿作為前百度前百度IDL異構(gòu)計算方向創(chuàng)始成員,曾入選過IBM PhD Fellowship(IBM博士英才計劃)項目。
聯(lián)合創(chuàng)始人韓松在2016年世界頂級深度學習會議ICLR上,以一篇Deep Compression(深度神經(jīng)網(wǎng)絡壓縮)論文與AlphaGo的開發(fā)者——谷歌DeepMind共同活動了最佳論文獎,同時因為其很高的研究造詣,韓松將于2018年任職MIT(麻省理工)助理教授。
另一位聯(lián)合創(chuàng)人汪玉是清華電子系副教授,國家自然科學基金“優(yōu)青”獲得者,清華大學教改以來首批終身教授,汪玉從2006年就已經(jīng)開始研究FPGA,并且是現(xiàn)任ACM FPGA技術(shù)委員會亞太地區(qū)唯一成員。
所以,雖然深鑒科技在2016年才成立,但是已經(jīng)吸引了來自百度、360、華為、風河、Intel、Nokia等公司在內(nèi)的大批行業(yè)精英,使得整個團隊在具有國際學術(shù)影響力的同時又具備了資深的工業(yè)經(jīng)驗。
資料顯示,深鑒科技最為核心的即Deep Learning Processing Unit(DPU)及神經(jīng)網(wǎng)絡壓縮編譯技術(shù),甚至被世界最大的FPGA芯片廠商Xilinx認為是世界深度學習硬件加速的典范。
所謂DPU既深度學習處理器,其精髓就在于使用了深度壓縮技術(shù)。這項技術(shù)不僅可以將神經(jīng)網(wǎng)絡壓縮數(shù)十倍而不影響精度,還可以使用芯片存儲深度學習算法模型,減少內(nèi)存讀取次數(shù),大大降低運行功耗。
與此同時,基于優(yōu)化協(xié)同性,深度壓縮技術(shù)對于硬件本身也提出了新的要求。為此,深鑒科技推出了兩種用于深度學習處理器的底層架構(gòu)——亞里士多德架構(gòu)和笛卡爾架構(gòu),以及面向DPU的深度神經(jīng)網(wǎng)絡開發(fā)工具包DNNDK。
姚頌認為,所有產(chǎn)品都可以分為四個層次:能用、好用、讓用戶想用、讓用戶愛用——AI芯片產(chǎn)品也是如此。
對于AI芯片來說:
第一層是能用,就是這塊芯片能夠跑AI、能夠?qū)ι疃葘W習運算進行加速。
第二層是好用,如何讓這塊芯片支持的AI算法種類多一點,讓用戶開發(fā)起來更簡單。
第三層是想用,那就是用戶用你的產(chǎn)品開發(fā)起來更簡單、算法跑出來性能更好,選擇別的產(chǎn)品時開發(fā)起來更麻煩。
第四層則是愛用,也就是用戶粘性高,當很多使用你的芯片的人集成在一起,形成社區(qū)與軟件生態(tài),有很多開放的項目代碼可以供人交流參考,這就不僅是能用或者好用了,而是讓用戶愛用。
人工智能的兩個方向
近年來,英特爾、英偉達、Facebook、微軟、Google、IBM、蘋果、華為等科技公司都在積極布局AI芯片,復雜的深度學習網(wǎng)絡計算需求很高,除了云計算,需要有更多更強大的本地計算資源。
咨詢公司Tractica的預測數(shù)據(jù)顯示,到2025年,與人工智能相關(guān)的深度學習芯片組市場收入,將由去年的5億美元飆升至122億美元的規(guī)模,復合年均增長率超過40%。這一數(shù)據(jù)不僅是基于巨頭的參與,也是源自人工智能創(chuàng)業(yè)企業(yè)近年來的爆發(fā)。
要知道,從1956人工智能概念被提出以來,經(jīng)歷60多年的發(fā)展,這項技術(shù)前后經(jīng)歷了多次跌宕起伏。隨著AlphaGo打敗李世石這樣的典型案例出現(xiàn),無論是各國政府還是資本市場,都將人工智能視為今后發(fā)展的戰(zhàn)略中心。
我國更是提出了要將人工智能與傳統(tǒng)行業(yè)進行深度融合,這為一大批企業(yè)提供了極好的發(fā)展空間。更為重要的是,“大眾創(chuàng)業(yè)萬眾創(chuàng)新”的新時代也為廣大創(chuàng)業(yè)者提供了良好的發(fā)展平臺。
在這波人工智能的創(chuàng)業(yè)浪潮中,有兩個創(chuàng)業(yè)方向:1、以算法為主,做算法研究 ;2、以硬件為主,做AI芯片。
總結(jié)
在這場硝煙尚未完全燃起的戰(zhàn)爭中,美國一直以來是全球人工智能領(lǐng)域領(lǐng)跑的國家,但中國已經(jīng)開始著手加速入局。這兩年,數(shù)家中國公司開始芯片研發(fā),“XPU”的出現(xiàn)如雨后春筍。
而以地平線,寒武紀,深鑒科技為主的大批人工智能芯片企業(yè)正在以各自對于人工智能行業(yè)的獨特思考,不斷的摸索自己的發(fā)展之路,創(chuàng)造屬于自己的人工智能領(lǐng)域。
地平線的發(fā)展策略是,針對使用場景需求研究最適合的算法框架,然后將算法框架實現(xiàn)在芯片上,其目的是做“嵌入式人工智能”,用芯片加算法的模式,進行單點突破。
寒武紀則選擇了另一條路徑。2016年發(fā)布了人工智能專用指令集后,寒武紀在軟件平臺投入了大量的人力。寒武紀不僅令處理器可以支持主流的編程框架,同時開發(fā)了專用函數(shù)庫、編譯器、模型生成工具等,降低開發(fā)者使用的門檻。相對而言,寒武紀的芯片通用性更強。
而深鑒科技走的是為深度學習提供高效靈活的軟硬一體解決方案的道路。無論是推出Deep Learning Processing Unit(DPU)還是神經(jīng)網(wǎng)絡壓縮編譯技術(shù),深鑒科技始終認為,每家AI芯片公司都需要成為一家軟件&系統(tǒng)公司,這樣才能在市場競爭中取得優(yōu)勢。