《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 解決方案 > 對(duì)話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),以算法起家的AI芯片公司后勁十足

對(duì)話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),以算法起家的AI芯片公司后勁十足

2019-01-24

目前,物聯(lián)網(wǎng)人工智能(AI)都是發(fā)展大勢(shì)。而 AI 芯片正處于從通用型向?qū)S眯桶l(fā)展和轉(zhuǎn)化的過程當(dāng)中,特別是在物聯(lián)網(wǎng)邊緣側(cè),通用型 AI 芯片的計(jì)算效率較低,繼而帶來了成本和功耗的失配。此外,AI 芯片要面對(duì)很多不同場(chǎng)景,很難有一款通用型產(chǎn)品能滿足不同客戶的需求。


目前來看,有越來越多的專用型 AI 芯片或模組的案例涌現(xiàn)出來,如智能家居、機(jī)器人、智能音箱等,都對(duì)專用型 AI 芯片提出了越來越多的需求。


因此,當(dāng)今做 AI 芯片是符合市場(chǎng)發(fā)展需求的,在這方面,越來越多的公司更加務(wù)實(shí),將其作為長(zhǎng)期的發(fā)展戰(zhàn)略,而不是抱著投機(jī)的心態(tài)去做 AI 芯片。云知聲就是這樣一家本土企業(yè)。2018 年 5 月,該公司正式發(fā)布首款物聯(lián)網(wǎng)專用 AI 芯片之后,不足半年的時(shí)間,今年 1 月其再次對(duì)外宣布多模態(tài) AI 芯片的研發(fā)計(jì)劃。

微信圖片_20190124201144.jpg


物聯(lián)網(wǎng)芯片設(shè)計(jì)難在哪兒?


隨著應(yīng)用的發(fā)展,物聯(lián)網(wǎng)的場(chǎng)景化特點(diǎn)會(huì)愈加突出,此時(shí),只提供單一芯片已經(jīng)很難滿足客戶需求,必須要將芯片、應(yīng)用,以及服務(wù)等有機(jī)地融合在一起,從而提供一整套的解決方案,才能滿足實(shí)際的應(yīng)用需求。


與此同時(shí),在 IC 設(shè)計(jì)層面,與傳統(tǒng)模式和流程相比,會(huì)更加復(fù)雜,對(duì)此,云知聲聯(lián)合創(chuàng)始人/ IoT 事業(yè)部副總裁李霄寒博士表示:“在最初的設(shè)計(jì)階段,就要考慮應(yīng)用算法,以及到底需要多大的算力,如何使軟件能更好地運(yùn)行等因素。這樣,就需要 IC 設(shè)計(jì)團(tuán)隊(duì)與算法提供者有更緊密的合作。此時(shí),軟件和硬件的耦合會(huì)非常緊密,這會(huì)影響到開發(fā)流程。傳統(tǒng)的 IC 設(shè)計(jì)主要是根據(jù)應(yīng)用來設(shè)計(jì)相關(guān)參數(shù),而未來物聯(lián)網(wǎng)應(yīng)用當(dāng)中的芯片,特別是 AI 芯片,在設(shè)計(jì)階段,就要根據(jù)實(shí)際的應(yīng)用場(chǎng)景,設(shè)計(jì)出相應(yīng)的功能,然后再去合理調(diào)配軟件和硬件資源,這對(duì)設(shè)計(jì)者的綜合水平和能力提出了更高的要求?!?/p>


在物聯(lián)網(wǎng)的邊緣側(cè),對(duì) AI 芯片的性能、功耗和成本提出了更好的平衡要求。對(duì)此,李霄寒表示,性能仍然是要優(yōu)先考量的,也是最重要的,在此前提下,再去追求功耗與成本的平衡,而在邊緣側(cè),成本比功耗更加重要一些。


那么,對(duì)于邊緣側(cè) AI 芯片設(shè)計(jì)者來說,如何能實(shí)現(xiàn)以上這些因素的平衡呢?李霄寒認(rèn)為:首先,設(shè)計(jì)者的算法積累很重要,因?yàn)楹玫乃惴茏層布l(fā)揮最大的效能;其次,IC 設(shè)計(jì)能力自然也很重要,特別是要能與業(yè)界實(shí)現(xiàn)良好的配合,以挖掘出更多的 IC 設(shè)計(jì)潛力;還有一點(diǎn),也是經(jīng)常被忽略的,那就是對(duì)場(chǎng)景的了解,即經(jīng)歷過整個(gè)流程,并有產(chǎn)品的量產(chǎn),才能對(duì)很多實(shí)際的考量因素有清晰的認(rèn)知,也就是 KnowHow,其會(huì)指導(dǎo)你的芯片設(shè)計(jì)流程。這一點(diǎn)非常重要。


芯片發(fā)展路線


據(jù)悉,云知聲于 2015 年開始量產(chǎn) IVM 模組,其采用了市場(chǎng)上的通用型芯片。由于當(dāng)時(shí)市場(chǎng)上還沒有通用型的 AI 芯片,所以多是以多核的 CPU 來實(shí)現(xiàn) AI 加速器的功能。也就是在 2015 年,該公司決定自行做 AI 芯片,并開始了相關(guān)的規(guī)劃和研發(fā)工作。


經(jīng)過兩年多的研發(fā),2018 年5 月,云知聲發(fā)布了其 UniOne 第一代產(chǎn)品——雨燕,這是一款單模態(tài)的語(yǔ)音專用的 AI 芯片。據(jù)悉,該公司不僅提供雨燕芯片,還提供相應(yīng)的開源解決方案,包含芯片、引擎、應(yīng)用,甚至還有云端服務(wù),以及手機(jī) APP 代碼。據(jù)李霄寒介紹,這樣做,有利于客戶快速部署其產(chǎn)品,省去了找第三方開發(fā)各種應(yīng)用的時(shí)間和成本。


據(jù)悉,目前已經(jīng)有近 10 家客戶導(dǎo)入了雨燕芯片,而且在今年上半年,很快就能在市場(chǎng)上看到相應(yīng)的量產(chǎn)產(chǎn)品。

微信圖片_20190124201213.jpg


當(dāng)今的 AI 芯片領(lǐng)域,存在著多種架構(gòu),每家都有不同的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)產(chǎn)品,那么,云知聲的 AI 芯片是采用怎樣的架構(gòu)和IP呢?據(jù)悉,第一代雨燕芯片采用的是該公司自行研發(fā)的 DeepNet 1.0,而其正在研發(fā)的新一代多模態(tài) AI 芯片則采用了升級(jí)版本—— DeepNet 2.0。


向多模態(tài)演進(jìn)


在物聯(lián)網(wǎng)應(yīng)用初期,很多 AI 芯片都是以單模態(tài)功能切入市場(chǎng)的,最為普遍的就是語(yǔ)音應(yīng)用。但是,未來的應(yīng)用會(huì)是多模態(tài)融合的,機(jī)器人就是一個(gè)典型的多模態(tài)應(yīng)用實(shí)例,還有如車載芯片,因此,多模態(tài)是市場(chǎng)發(fā)展的必然趨勢(shì)。云知聲在原有單模態(tài)語(yǔ)音 AI 芯片的基礎(chǔ)上,正在研發(fā)多模態(tài)芯片,主要針對(duì)語(yǔ)音和圖像的處理需求,其相應(yīng)的產(chǎn)品就是基于 DeepNet 2.0的。

微信圖片_20190124201231.jpg


據(jù)悉,云知聲以 DeepNet 2.0 IP 為核心的 AI 架構(gòu),算力可以達(dá)到 4T。DeepNet 2.0 是多模態(tài)神經(jīng)網(wǎng)絡(luò)處理器 IP,其主要特點(diǎn)是可以支持多種推理網(wǎng)絡(luò)兼容,如 LSTM、CNN、RNN 以及 TDNN 等;支持可重構(gòu)計(jì)算;還支持 Winograd 處理,將乘法計(jì)算量降至原先的一半以下,大幅提升了計(jì)算效率。李霄寒表示,DeepNet 2.0 是相對(duì)通用的 IP 核,既可以滿足音頻應(yīng)用需求,也可以實(shí)現(xiàn)對(duì)圖像的處理。


另外,DeepNet 2.0 還支持多 NPU 的組網(wǎng),組成模塊化的網(wǎng)絡(luò),來支持算力的需求。


對(duì)于架構(gòu),李霄寒表示,雖然每家的架構(gòu)都有各自的特點(diǎn)和實(shí)現(xiàn)方法,但其上面的軟件會(huì)逐步達(dá)成統(tǒng)一,也就是說,支持機(jī)器學(xué)習(xí)的算法會(huì)逐漸形成統(tǒng)一的框架。未來,有可能形成在不同 AI 芯片硬件上面,可以運(yùn)行所有神經(jīng)網(wǎng)絡(luò)的模型,這在不久的將來是完全有可能出現(xiàn)的。


一直以來,一提起云知聲,業(yè)內(nèi)人士第一反應(yīng)就是:這是一家做語(yǔ)音方案的公司,對(duì)此,李霄寒表示:“大家給云知聲貼的這個(gè)標(biāo)簽是片面的,并沒有反應(yīng)出我們公司全部能力。實(shí)際上,云知聲在圖像處理方面也有多年的技術(shù)積累。我們?cè)谶@塊很早就開始布局了,并在 2018 年開始發(fā)力,將相應(yīng)的算法融入到了實(shí)際的產(chǎn)品當(dāng)中?!?/p>


據(jù)悉,為了在智能語(yǔ)音、圖像處理等多模態(tài)技術(shù)方面實(shí)現(xiàn)快速突破,云知聲很早便在內(nèi)部搭建了號(hào)稱云知聲版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 機(jī)器學(xué)習(xí)計(jì)算平臺(tái),基于該平臺(tái)可以實(shí)現(xiàn)各種算法的快速迭代,而且可以靈活調(diào)整算法和算力,極大地提升了研發(fā)效率。

微信圖片_20190124201304.jpg


在核心競(jìng)爭(zhēng)力方面,云知聲采用的都是自家多年積累的 IP。對(duì)此,李霄寒表示:“我們?cè)谘邪l(fā)、推廣芯片產(chǎn)品的同時(shí),逐步建立、鍛煉出了一支強(qiáng)有力的隊(duì)伍。我們?cè)谧稣Z(yǔ)音專用的 DeepNet 1.0 的時(shí)候,市場(chǎng)上還沒有相關(guān)的產(chǎn)品,只有自己研發(fā)。而且,在推向時(shí)候以后,反響不錯(cuò),我們才實(shí)實(shí)在在地意識(shí)到這是一款很不錯(cuò)的產(chǎn)品,非常適合我們的算法和場(chǎng)景。因此,在此基礎(chǔ)上,我們發(fā)展出了 DeepNet 2.0,與 DeepNet 1.0 相比,DeepNet 2.0 在功能上有了極大的增強(qiáng),特別是算力方面,達(dá)到了 4T,另外,DeepNet 2.0 可以支持多種 NPU,這也就意味著可以支持多模態(tài)?!?/p>

微信圖片_20190124201320.jpg


就在今年 1 月初,云知聲正式對(duì)外宣布,其正在研發(fā)數(shù)款多模態(tài) AI 芯片,分別是面向物聯(lián)網(wǎng)的雨燕-Lite,這是第一代雨燕的升級(jí)版本;面向智慧城市的海豚(Dolphin);面向智慧出行的車規(guī)級(jí)芯片雪豹(Leopard)。


發(fā)展三階段


對(duì)于云知聲的發(fā)展歷程,李霄寒做出了這樣的總結(jié):公司于 2012 年成立,至今已有 6 年多的時(shí)間,該公司將其發(fā)展歷史分成了 3 個(gè)階段。


李霄寒表示:“公司成立之初的兩年,是技術(shù)優(yōu)勢(shì)構(gòu)建階段。在該階段,云知聲主要提供軟件算法、引擎,服務(wù)等;從 2015 年開始,我們進(jìn)入到了產(chǎn)品優(yōu)勢(shì)構(gòu)建階段,也就是大家所熟知的“云端芯”的產(chǎn)品體系。從那時(shí)起,云知聲就不是只提供算法這么簡(jiǎn)單了,而是開始提供應(yīng)用產(chǎn)品了,起初以軟件為主,而且是整合了各種軟件服務(wù)的產(chǎn)品。而智能醫(yī)療是我們的主戰(zhàn)場(chǎng),可以提供一整套的軟硬件方案。在 2015 年之前,云知聲是不具備硬件設(shè)計(jì)能力的,為了補(bǔ)齊短板,我們?cè)谏钲诔闪⒘艘患曳止?,專門進(jìn)行硬件設(shè)計(jì)和研發(fā);做出產(chǎn)品以后,我們進(jìn)入了規(guī)模優(yōu)勢(shì)構(gòu)建階段,基于我們的芯片,實(shí)現(xiàn)大規(guī)模的量產(chǎn),而且在相應(yīng)的應(yīng)用領(lǐng)域,排名行業(yè)第一。我們一直在觀察市場(chǎng)和時(shí)代需求,以建設(shè)我們相應(yīng)的能力,進(jìn)而幫助客戶解決問題。這也是我們于 2015 決定做芯片的主要原因,市場(chǎng)需求在那里,我們就去做。而且當(dāng)時(shí)市場(chǎng)上還沒有專用的 AI 芯片,為了滿足客戶對(duì)軟硬件的整體需求,我們必須自己研發(fā) AI 芯片?!?/p>


加快腳步 只爭(zhēng)朝夕


未來,不同的應(yīng)用場(chǎng)景和領(lǐng)域會(huì)對(duì) AI 芯片有不同的規(guī)范和標(biāo)準(zhǔn)要求,包括功耗、接口等方面,都會(huì)形成相應(yīng)的標(biāo)準(zhǔn)。“未來,AI 算法很可能都會(huì)有相應(yīng)的標(biāo)準(zhǔn)出臺(tái)”,李霄寒表示:“硬件和軟件之間的算法接口,很可能在不久的將來制定標(biāo)準(zhǔn),這樣,就可以實(shí)現(xiàn)在同一AI 芯片上運(yùn)行不同廠家的算法,這種可能性是完全存在的。而對(duì)于我們公司來說,要爭(zhēng)取走得足夠快,爭(zhēng)取成為標(biāo)準(zhǔn)的實(shí)際制定者。實(shí)際上,我們?cè)诩译婎I(lǐng)域已經(jīng)實(shí)現(xiàn)過類似的目標(biāo),云知聲是第一家在白色家電領(lǐng)域?qū)崿F(xiàn)專用語(yǔ)音芯片落地的供應(yīng)商,相應(yīng)的測(cè)試標(biāo)準(zhǔn)實(shí)際上是由我們制定的。我們做出測(cè)試規(guī)范之后,客戶就用該標(biāo)準(zhǔn)去要求所有的供應(yīng)商。未來我們依然會(huì)按照這樣的模式發(fā)展,爭(zhēng)取成為更多行業(yè)標(biāo)準(zhǔn)的實(shí)際制定者?!?/p>


對(duì)于端和邊緣側(cè) AI 芯片市場(chǎng),李霄寒認(rèn)為,邊緣側(cè)的 AI 芯片市場(chǎng)足夠大,而且仍然處于發(fā)展初期,遠(yuǎn)沒有到大家在一個(gè)紅海里拼殺的程度。關(guān)鍵還是要做好供給側(cè)的事情,市場(chǎng)的需求很大,也有很多廠商在跟進(jìn),但在現(xiàn)階段,大家的產(chǎn)品做的還都不夠好,雖然云知聲走在了市場(chǎng)的前列,但依然有很大的提升空間。


“對(duì)于云知聲來說,要只爭(zhēng)朝夕呀!”李霄寒說。



人物簡(jiǎn)介

微信圖片_20190124201339.jpg

李霄寒博士于 1994 年考入中國(guó)科學(xué)技術(shù)大學(xué)少年班, 2003 年獲得中科大信號(hào)與信息系統(tǒng)博士學(xué)位。他曾先后服務(wù)于聯(lián)想、摩托羅拉中國(guó)、 Nuance 中國(guó)、盛大語(yǔ)音創(chuàng)新院等國(guó)內(nèi)外知名公司,先后擔(dān)任技術(shù)經(jīng)理、主任工程師以及研發(fā)總監(jiān)職位。

 

他在 2001 年獲得“微軟學(xué)者”稱號(hào),在 2005 年參與世界第一款嵌入式非特定人中文語(yǔ)音識(shí)別軟件研發(fā)并將其廣泛用于摩托羅拉系列產(chǎn)品中;隨后在 2006 年參與世界第一款嵌入式說話人識(shí)別軟件的研發(fā)。李霄寒博士在 2002 年代表微軟,在 2010 年代表盛大參加“ NIST 國(guó)際說話人識(shí)別評(píng)測(cè)”大賽,共獲得七個(gè)單項(xiàng)第一、兩次總分第一名的優(yōu)異成績(jī)。

 

目前他作為云知聲聯(lián)合創(chuàng)始人及 IoT 事業(yè)部副總裁,分管產(chǎn)品研發(fā)。李霄寒博士負(fù)責(zé)帶隊(duì)研發(fā)的業(yè)界第一款物聯(lián)網(wǎng) AI 芯片在 2018 年上半年成功流片。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。