《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 業(yè)界動(dòng)態(tài) > AI新貴Gyrfalcon打造多款機(jī)器學(xué)習(xí)芯片

AI新貴Gyrfalcon打造多款機(jī)器學(xué)習(xí)芯片

2018-11-30
關(guān)鍵詞: 芯片 人工智能 LG電子

30年前,加州大學(xué)伯克利分校的博士生楊林(Frank Lin)想研發(fā)出一種特制芯片,能夠加快人工智能(AI)的運(yùn)算速度。

這個(gè)念頭開(kāi)啟了他長(zhǎng)達(dá)三十多年的研究生涯。

當(dāng)年一些具有洞察力的想法如今變成了現(xiàn)實(shí),與此同時(shí),楊博士作為首席科學(xué)家創(chuàng)立的初創(chuàng)公司GTI野心勃勃,不斷發(fā)展,專(zhuān)注于打造與眾不同的AI芯片,以期在競(jìng)爭(zhēng)日益激烈的芯片市場(chǎng)獨(dú)占鰲頭。

2017年初建立的GTI總部位于苗必達(dá)市,處于硅谷的邊緣地帶。GTI正在一步步實(shí)現(xiàn)楊博士在30年前的絕妙想法:同步運(yùn)算矩陣乘法的相同電路矩陣,從而加快神經(jīng)網(wǎng)絡(luò)的基本運(yùn)算。

 “我們是唯一一家將矩陣乘法作為基本運(yùn)算元素后取得實(shí)質(zhì)性進(jìn)展的公司?!苯邮躗DNet專(zhuān)訪的GTI總裁楊林如是說(shuō)。

楊林清楚地認(rèn)識(shí)到眾多初創(chuàng)企業(yè)都擁有新型AI半導(dǎo)體設(shè)計(jì),比如ZDNet近日?qǐng)?bào)道的Cornami、Flex Logix與Efinix等產(chǎn)品。

“有些芯片制造商正在思考matrix或tensor的新型架構(gòu)。” 楊林說(shuō),而GTI在一月份推出了第一款硅芯片產(chǎn)品。“談到真正的芯片,我覺(jué)得我們是市場(chǎng)上唯一一家真正的硅芯制造商。”

三星電子、LG電子、富士通等一些大體量客戶確信,GTI會(huì)提供他們需要的產(chǎn)品。

“剛開(kāi)始我們只有七個(gè)人?!盙TI營(yíng)銷(xiāo)總監(jiān)Marc Naddell補(bǔ)充道?!跋胂笠幌?,一小撮人在創(chuàng)業(yè)最開(kāi)始的八個(gè)月里致力于一款芯片的研發(fā)?!盢addell與楊林均強(qiáng)調(diào),Gyrfalcon是三星的獨(dú)家AI芯片合作伙伴。

“我們的第一款芯片大獲成功,因此像我們這樣歷史短、規(guī)模小的公司能夠贏得三星等大品牌的青睞?!彼f(shuō)道。

GTI產(chǎn)品致勝的關(guān)鍵在于其具備絕佳的能效,在性能方面勝過(guò)英特爾傳統(tǒng)中央處理器(CPU)與Nvidia圖形處理器(GPU)?!拔覀兙褪菍?duì)抗歌利亞的大衛(wèi)?!?楊林說(shuō)。

微信圖片_20181130195306.jpg

大衛(wèi)對(duì)抗歌利亞

備注:大衛(wèi)與巨人哥利亞的決斗是一個(gè)著名的西方典故,意為以弱勝?gòu)?qiáng)?!妒ソ?jīng)》中記載,歌利亞是非利士將軍,帶兵進(jìn)攻以色列軍隊(duì),后被牧童大衛(wèi)打敗。大衛(wèi)日后統(tǒng)一以色列,成為著名的大衛(wèi)王。

GTI的產(chǎn)品正在向品牌化方向發(fā)展時(shí),“Lightspeeur”以“2801”芯片為起點(diǎn),在今年國(guó)際消費(fèi)類(lèi)電子產(chǎn)品展覽會(huì)(Consumer Electronics Show 簡(jiǎn)稱(chēng) CES)上亮相?!癓ightspeeur”是一種用于“推理(inference)”的零件,而“推理”是機(jī)器學(xué)習(xí)的組成部分,神經(jīng)網(wǎng)絡(luò)利用訓(xùn)練階段習(xí)得的信息為新出現(xiàn)的問(wèn)題提供解決方案。該零件適用于“邊緣”設(shè)備,如智能手機(jī)、智能揚(yáng)聲器或筆記本電腦。

微信圖片_20181130195442.jpg

微信圖片_20181130195510.jpg

國(guó)際消費(fèi)電子展(CES)是世界最大的消費(fèi)類(lèi)電子產(chǎn)品展會(huì)

GTI指出,一種稱(chēng)為“存儲(chǔ)計(jì)算一體化”(APiM)的方法,讓所有相同的運(yùn)算單元與存儲(chǔ)融為一體,可大大降低外存儲(chǔ)器的利用率,從而大幅降低AI芯片的功率預(yù)算。

“2801”的運(yùn)算速度可達(dá)到每秒9.3萬(wàn)億次,僅耗能1瓦特,且每一次都是乘法累加運(yùn)算。如今,這樣“萬(wàn)億次/每秒”(TOPS)的計(jì)算單位是AI芯片能耗常見(jiàn)的表示方法。

它“比英特爾Movidius產(chǎn)品的能效高90%”,楊林在談到英特爾收購(gòu)?fù)綧ovidius時(shí)獲得的推理芯片時(shí)如是說(shuō)。

微信圖片_20181130195537.jpg

GTI第一代芯片Lightspeeur?2801S

繼“2801”后出現(xiàn)的“2803”于上月面世,旨在處理云服務(wù)器更加繁重的推理負(fù)載。其性能更佳,能效更好,耗能1瓦特時(shí),計(jì)算速度高達(dá)24 TOPS。GTI表示,“2803”不僅適用于推理,還可用于訓(xùn)練,利用一種技術(shù)優(yōu)化“馬爾科夫鏈蒙特卡洛”(Markov Chain Monte Carlo)網(wǎng)絡(luò),替代更為常見(jiàn)的隨機(jī)梯度下降(Stochastic gradient descent,SGD)。

 “2801”與“2803”都可以在電路板上聯(lián)結(jié),并且通過(guò)外部設(shè)備高速擴(kuò)展總線(PCI-E)作為插件同時(shí)運(yùn)行。兩者均擁有嵌入式存儲(chǔ)器,“2801”可存儲(chǔ)9兆字節(jié)。緊鄰所有運(yùn)算單位的存儲(chǔ)器,使芯片能夠承擔(dān)幾乎所有的推理工作,無(wú)需芯片外設(shè)DRAM。GTI將其稱(chēng)為“存儲(chǔ)計(jì)算一體化”或“APiM”。

“我可以一次性地將網(wǎng)絡(luò)模型、權(quán)重與激活單元預(yù)加載到這款芯片上?!?楊林說(shuō),“無(wú)需求助外部系統(tǒng);這樣做能夠明顯降低能耗,大幅提升芯片的性能。”

本月,GTI透露了下一產(chǎn)品的部分信息。該產(chǎn)品主要用于“物聯(lián)網(wǎng)Lot”領(lǐng)域,直到下個(gè)月才會(huì)正式發(fā)布。這個(gè)最新產(chǎn)品名為“2802”,提供了另一項(xiàng)有趣的技術(shù):非易失性存儲(chǔ)器(Non-volatile memory, NVM)。

“2802”以“磁性”隨機(jī)存儲(chǔ)器(MRAM)替代了“2801”與“2803”運(yùn)用的靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)。與NAND快閃存儲(chǔ)器相似,MRAM在能量耗盡時(shí)不會(huì)丟失數(shù)據(jù)。這意味著一套神經(jīng)網(wǎng)絡(luò)可由客戶進(jìn)行預(yù)加載,甚至可以在“2802”出廠前由原廠預(yù)加載。

GTI在乘法累加運(yùn)算(Multiply Accumulate, MAC)的同一套模具上制造MRAM,該方法是GTI正在申請(qǐng)的五十個(gè)專(zhuān)利之一??焖偎阉髅绹?guó)專(zhuān)利局的申請(qǐng)數(shù)據(jù)庫(kù)和授予專(zhuān)利,可迅速了解 GTI技術(shù)的具體情況。1992年,伯克利分校憑借楊博士及其導(dǎo)師Leon Chua的芯片發(fā)明獲得了一項(xiàng)專(zhuān)利。碰巧的是,Chua在該領(lǐng)域的大量研究可應(yīng)用于多項(xiàng)領(lǐng)域,包括Chua在1998年出版的專(zhuān)著《細(xì)胞神經(jīng)網(wǎng)絡(luò):復(fù)雜性的典范》(CNN:A Paradigm for Complexity)

當(dāng)然,困難之處在于軟件。與CPU和GPU不同,GTI的專(zhuān)用集成電路(ASIC)難以獲得編程棧。

微信圖片_20181130195601.jpg

對(duì)比:GTI的Lightspeeur與英特爾和Nvidia芯片在AI處理上的差別

因此,剛剛發(fā)布了一個(gè)開(kāi)發(fā)者軟件開(kāi)發(fā)工具包(SDK),為產(chǎn)品打造應(yīng)用程序。該開(kāi)發(fā)工具可在兩個(gè)硬件配件上進(jìn)行測(cè)試,即USB加密鎖“PLAI Plug”與獨(dú)立設(shè)備“PLAI WiFi”,后者可作為手機(jī)的無(wú)線加速工具。

GTI按照楊博士在伯克利制定的路線不斷發(fā)展,已經(jīng)邁出了似乎有風(fēng)險(xiǎn)的一步:正在卷積神經(jīng)網(wǎng)絡(luò)(CNN)上鋪設(shè)自己的電路。雖然那時(shí)楊博士使用的是“細(xì)胞神經(jīng)網(wǎng)絡(luò)”(“cellular neural networks, CNN”,Gyrfalcon依然在專(zhuān)利申請(qǐng)文件中使用該術(shù)語(yǔ))這樣的模型,但其具有獨(dú)創(chuàng)性的研究工作圍繞卷積運(yùn)算展開(kāi)。

當(dāng)然,卷積神經(jīng)網(wǎng)絡(luò)在近幾年來(lái)成為了最重要的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)之一,但這一做法讓芯片不太適用于其他類(lèi)型的網(wǎng)絡(luò),如“長(zhǎng)短期記憶”網(wǎng)絡(luò)。

不過(guò),楊林并未對(duì)理論上的局限性憂心忡忡。

“CNN是所有其他AI的基礎(chǔ)。”他說(shuō)?!皩?duì)此,我們做了研究,發(fā)現(xiàn)ResNet和MobileNet在CNN市場(chǎng)中依然占主導(dǎo)地位。”楊林說(shuō),其他初創(chuàng)公司正在試圖進(jìn)軍每一種網(wǎng)絡(luò),“他們?cè)噲D覆蓋所有現(xiàn)存及未來(lái)的神經(jīng)網(wǎng)絡(luò),但我還沒(méi)有發(fā)現(xiàn)任何一家公司能夠成功地兼顧全面性與能效性?!?/p>

如果新型網(wǎng)絡(luò)出現(xiàn),占據(jù)了大部分的市場(chǎng)份額,“那我們就會(huì)針對(duì)它推出另外一款芯片?!彼f(shuō)。

一個(gè)很有意思的想法是,(如果)按照生產(chǎn)曲線看一看GTI在發(fā)展時(shí)發(fā)生了什么,是什么使其電路更加高效。GTI的初代產(chǎn)品由臺(tái)灣半導(dǎo)體制造商28納米制造工藝完成,與英特爾和Nvidia的尖端產(chǎn)品相比,該工藝運(yùn)用的節(jié)點(diǎn)更為陳舊。

“我們正在用28納米的工藝擊敗正在使用7納米或12納米的同行,比如Nvidia?!?楊林說(shuō)?!拔覀兪侨缤月褤羰姆磁颜?,但我們贏了!”

Marc Naddell,這位GTI的營(yíng)銷(xiāo)總監(jiān)補(bǔ)充道:“當(dāng)我們采用12納米或7納米的工藝時(shí),其他公司將會(huì)做什么呢?”

GTI的另一條發(fā)展途徑就是將自主研發(fā)的芯片授權(quán)給其他AI芯片制造商。楊林目前的工作重心并沒(méi)有放在這上面,但他看到許多潛力?!癎raphcore等其他初創(chuàng)公司做的東西與我們極其相似,但如果他們想做大,就必須找我們?!?/p>

根據(jù)最新數(shù)據(jù),Graphcore籌措到的金額超過(guò)1億美元。資金支持對(duì)芯片初創(chuàng)企業(yè)至關(guān)重要,因?yàn)橐患夜緩脑O(shè)計(jì)到芯片的初步“流片”,再到開(kāi)發(fā)和維護(hù)客戶基礎(chǔ),平均需要投入數(shù)億美元。

GTI沒(méi)有向記者透露公司籌集到的資金數(shù)額,但他們表示,他們已經(jīng)“從美國(guó)、日本、韓國(guó)、中國(guó)的機(jī)構(gòu)與企業(yè)投資者手中獲得三輪融資”,并補(bǔ)充道:“就目前的員工配置與支出率來(lái)說(shuō),籌措的資金可供公司運(yùn)營(yíng)至少三年時(shí)間。



本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。