《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > AI語音芯片火熱的背后邏輯是什么

AI語音芯片火熱的背后邏輯是什么

2018-07-21
關(guān)鍵詞: 造芯 AI 智能音箱 亞馬遜

如果要概括近兩年的AI創(chuàng)企現(xiàn)狀,融資和造芯是繞不開的話題。而芯片這個(gè)詞,極有可能會(huì)入選2018年年度關(guān)鍵詞。

從去年開始起來的熱度,在中興事件的催化下,快速發(fā)生更強(qiáng)烈的化學(xué)反應(yīng)。這其中,最耐人尋味的便是AI語音芯片的快速崛起:

1532046699290045015.jpg

5月到7月,短短兩個(gè)月的時(shí)間,從公開報(bào)道的資料可以看到有超過5家公司對外宣布做了AI語音芯片:

那么,為什么大家會(huì)不約而同的在當(dāng)下這個(gè)時(shí)間節(jié)點(diǎn)發(fā)布AI語音芯片,這背后的邏輯到底是什么呢?

導(dǎo)火索:智能音箱市場的小爆發(fā)

1532046699457074912.jpg

今年的618促銷活動(dòng),天貓精靈玩了一把價(jià)格營銷戰(zhàn),只需要99元就能購買一臺(tái)智能音箱。很快,在7月5日,天貓精靈就宣布一年時(shí)間內(nèi),他們的全渠道銷量累計(jì)超過500萬臺(tái)。

這種巨頭壓低價(jià)格走量的行為,很快引起了連鎖反應(yīng),關(guān)于智能音箱風(fēng)口的討論甚囂塵上,由亞馬遜帶起的這陣風(fēng)終于刮到了國內(nèi)。

根據(jù)Strategy Analytics 最新發(fā)布的研究報(bào)告顯示,2018年第一季度,全球智能音箱的總銷量達(dá)到920萬,同比增長278%。

“當(dāng)設(shè)備的量剛起來的時(shí)候,大家突然意識(shí)到芯片是很重要的一個(gè)環(huán)節(jié),將它的必要性放到一個(gè)更高的位置?!弊鳛樽钤玳_始布局AI語音芯片的云知聲,其創(chuàng)始人黃偉談到最近的芯片熱如是說道。

這一輪智能音箱市場的爆發(fā),讓不少人看到潛在的AI語音芯片市場機(jī)會(huì)。

據(jù)今年3月外媒Information的報(bào)道,亞馬遜正在設(shè)計(jì)定制用于支持智能音箱Echo的AI芯片,當(dāng)時(shí)消息稱亞馬遜已經(jīng)擁有449名有芯片專業(yè)知識(shí)、技能的員工。

無獨(dú)有偶,剛剛被阿里收購的中天微,也在7月初表示要發(fā)布智能語音芯片。

巨頭潛在的動(dòng)作是最重要的市場風(fēng)向標(biāo)之一,這個(gè)導(dǎo)火索也順其自然地燃到了AI語音芯片上,探尋其背后的邏輯,也在于AI語音芯片較之于傳統(tǒng)通用芯片的優(yōu)勢。

其實(shí)最早的通用芯片在語音方面發(fā)揮的功效并不大,通常情況下就是將多媒體數(shù)字編碼器+數(shù)字信號(hào)模塊處理相結(jié)合。

在2014年年底的時(shí)候,亞馬遜的Echo問世,有些半導(dǎo)體廠商瞄準(zhǔn)了這塊市場,開始推出語音芯片,其中最典型的莫過于聯(lián)發(fā)科。據(jù)了解,當(dāng)時(shí)有人推測2016年智能音箱市場將近80%的芯片都是MTK提供的,而這又得益于他們和亞馬遜Echo的深度合作。

當(dāng)智能硬件對語音交互的要求越來越高的時(shí)候,很多東西需要在端上實(shí)現(xiàn),比如喚醒、數(shù)據(jù)信號(hào)處理。同時(shí)考慮安全、網(wǎng)絡(luò)情況等因素,AI語音芯片出現(xiàn)是必然結(jié)果。

相比較語音芯片,AI語音芯片集成度高、功耗低、成本低,能夠?qū)崿F(xiàn)算法和終端的完美結(jié)合。

Rokid聯(lián)合創(chuàng)始人王舜德在回答當(dāng)初為什么會(huì)做AI語音芯片的時(shí)候,就提到“因?yàn)槲覀冎雷霎a(chǎn)品的痛苦,了解芯片的價(jià)錢會(huì)帶動(dòng)整個(gè)產(chǎn)品,而當(dāng)時(shí)的芯片非常耗電,集成度低。經(jīng)歷過這些痛點(diǎn),我們就想優(yōu)化芯片的設(shè)計(jì),用上我們前端的算法?!?/p>

算法—芯片—硬件:商業(yè)化落地的必然

仔細(xì)梳理一下現(xiàn)在幾大主流AI創(chuàng)企做AI語音芯片的思路,大多數(shù)還是選擇和有經(jīng)驗(yàn)的芯片公司深度合作。

比如出門問問和Rokid就宣布自己的芯片是基于杭州國芯科技芯片深度定制,其中Rokid的KAMINO18基于40nm工藝的國芯GX8010制造,GX8010是國芯去年發(fā)布的主打AI交互的NPU芯片,該芯片專為物聯(lián)網(wǎng)應(yīng)用設(shè)計(jì),具備低功耗、可離線、可移動(dòng)的優(yōu)勢。思必馳在宣布打造芯片的時(shí)候,也提到他們會(huì)和某芯片巨頭在AI芯片方面達(dá)成合作,成立合資公司。

芯片公司提供低功耗、集成度低的設(shè)計(jì)架構(gòu),AI語音技術(shù)公司則會(huì)在麥克風(fēng)陣列信號(hào)處理、語音交互SDK以及語音降噪、喚醒、識(shí)別理解上做功夫,將自有的AI語音交互技術(shù)集成到其中。

為什么算法技術(shù)落地,要從芯片以后后續(xù)的硬件開始,個(gè)中緣由離不開我國的軟硬件環(huán)境。

華為的輪值CEO徐直軍在2018年軟博會(huì)上曾提到:“國內(nèi)客戶尤其不接受軟件收費(fèi),導(dǎo)致國內(nèi)軟件產(chǎn)品型企業(yè)無法形成商業(yè)模式?!?/p>

大家接受的軟件銷售模式就是類似于硬件的模式,國內(nèi)就認(rèn)為硬件很值錢,軟件不值錢,認(rèn)為它的成本低。

所以在國內(nèi)如果要實(shí)現(xiàn)業(yè)務(wù)和商業(yè)快速增長,規(guī)模化的爆發(fā),只做算法、軟件是非常困難的。最新的技術(shù)、方案,包括產(chǎn)品通過硬件載體的方式更有可能實(shí)現(xiàn)規(guī)?;脑鲩L和復(fù)制。

所以,AI公司的算法集成到芯片公司的語音芯片中,可以說是一個(gè)省力又討好的合作,而AI語音芯片伴隨著各種智能硬件熱度上升也是水到渠成的事情。

另外,刨除這些技術(shù)因素,講好芯片的故事,也有助于AI企業(yè)獲得融資,有更多的資本施展自己的實(shí)力。尤其是當(dāng)下的時(shí)間節(jié)點(diǎn):做芯片既是技術(shù)實(shí)力的表現(xiàn),也是民族情懷的象征體。

在這樣一個(gè)天時(shí)地利人和的背景下,AI語音芯片走向崛起爆發(fā)期,實(shí)屬意料之中。

當(dāng)然,也不排除還有一些跟風(fēng)者想在浮躁的市場里作個(gè)“網(wǎng)紅”,蹭一波AI語音芯片的熱度,不過做芯片不是做肥皂,規(guī)?;漠a(chǎn)業(yè)考驗(yàn)的不僅僅是技術(shù)實(shí)力,還有商業(yè)落地能力以及風(fēng)險(xiǎn)承擔(dān)能力。

虛火還是實(shí)熱?

智能音箱的蝴蝶效應(yīng)以及芯片熱度等表征原因之外,從需求和產(chǎn)業(yè)去洞悉這次AI語音芯片熱的話,還得從更廣闊的應(yīng)用場景以及商業(yè)落地說起。

清華大學(xué)微電子所所長魏少軍在接受媒體采訪時(shí)曾表示,AI的殺手級(jí)應(yīng)用還沒出現(xiàn),不管是智能音箱還是其他產(chǎn)品,都還沒有成為一個(gè)剛需。因此,只有使語音真正成為人機(jī)交互的主流,才能推動(dòng)AI語音芯片的爆發(fā)。

所以盡管AI芯片熱度高,但隨之而來的理性聲音會(huì)問到語音技術(shù)的真實(shí)需求市場到底在哪里?

以智能音箱為例,在沒有形成家居物聯(lián)網(wǎng)前,很多人認(rèn)為其更像是一個(gè)擺設(shè)性的雞肋硬件。在當(dāng)下技術(shù)還未達(dá)到理想情況下,可以說消費(fèi)端市場對于語音交互和識(shí)別等的剛需仍然有待挖掘。

為此我們整理了幾大AI語音技術(shù)公司的產(chǎn)品和方案:\

1532046699648076674.jpg

回頭看國外的科技巨頭,也是遵循著相似的路徑在發(fā)展,他們通過投資或者收購的手段,做硬件,開放應(yīng)用平臺(tái)。

1532046699760092657.jpg

從上述表格中可以看出,目前,無論是像思必馳、云知聲、出門問問、Rokid這樣的AI創(chuàng)企,還是谷歌、亞馬遜、蘋果這樣的巨頭,他們在應(yīng)用場景的落地上有諸多交叉,大多偏向以物聯(lián)網(wǎng)為中心,圍繞智能家居、車載、機(jī)器人展開布局。而智能家庭、物聯(lián)網(wǎng)的主戰(zhàn)場之外,像智慧醫(yī)療、也是這些AI企業(yè)正在拓展的新邊疆。

同時(shí),根據(jù)易觀的報(bào)告來看,智能語音市場整體處于高速發(fā)展期,基于語音交互的智能車載,智能家居,智能可穿戴等垂直領(lǐng)域都將日趨成熟。

在這些場景中,人工智能語音技術(shù)雖然算不上非常核心和必不可少的技術(shù),但是沿襲消費(fèi)升級(jí)和技術(shù)迭代的發(fā)展軌跡,AI語音芯片背后所承載的語音識(shí)別、交互技術(shù)絕對是大勢所趨。

基于這樣的發(fā)展路徑規(guī)劃以及龐大的消費(fèi)市場的預(yù)測,AI語音芯片的火熱也是理所當(dāng)然。

就像一個(gè)人的身體是由多個(gè)器官組成的,在很多智能應(yīng)用場景,AI語音芯片扮演的角色更多的是算法技術(shù)的顯性體現(xiàn),芯片作為“硬件”去配合自家的軟件解決方案,最終去完成生態(tài)的閉環(huán)。

披荊斬棘的關(guān)鍵:技術(shù)+數(shù)據(jù)

做AI語音芯片是個(gè)投入巨大的工程,Rokid聯(lián)合創(chuàng)始人王舜德表示,“芯片最重要的一個(gè)點(diǎn)就是量,芯片關(guān)鍵的利潤就是上五百萬以上?!?/p>

那么企業(yè)如果想要擁有自造血能力,目前面對的最大瓶頸又是什么?”

王舜德提出了兩點(diǎn):數(shù)據(jù)和交互。其中,交互指的是“現(xiàn)在語音技術(shù)連一般小白用戶的行業(yè)理想都沒達(dá)到 ”,這也意味著語音技術(shù)還處在非常早期的階段。

1532046699908076729.png

而以數(shù)據(jù)為例,AI公司的競爭力表現(xiàn)之一就是數(shù)據(jù),如何在行業(yè)內(nèi)實(shí)現(xiàn)深度回流,是AI語音技術(shù)公司需要解決的問題。因?yàn)橹挥袑?shí)現(xiàn)深度數(shù)據(jù)回流之后,在行業(yè)內(nèi)做算法才會(huì)更加精準(zhǔn),產(chǎn)品競爭力更強(qiáng)。

但是整個(gè)人工智能里除了核心算法和算力外,場景和數(shù)據(jù)也非常重要:技術(shù)、方案、產(chǎn)品在核心應(yīng)用場景上要能夠推廣出去,最終給公司帶來切切實(shí)實(shí)營收。

確實(shí),除一體化的解決方案之外,與場景的深度融合才是未來真正的考驗(yàn)。安創(chuàng)空間聯(lián)合創(chuàng)始人楊宇欣表示,“AI公司如果只做芯片,沒有算法和場景的話立馬就會(huì)遇到生態(tài)系統(tǒng)的問題。現(xiàn)在有了算法和芯片,關(guān)鍵的問題是如何深入場景打造優(yōu)秀的語音交互體驗(yàn)?!?/p>

技術(shù)之外,思必馳的高始興也強(qiáng)調(diào)了產(chǎn)業(yè)落地的重要性,“技術(shù)和產(chǎn)業(yè)要形成一個(gè)循環(huán),而且要把握好窗口期,機(jī)會(huì)過了就沒有了?!?/p>

在AI賦能傳統(tǒng)行業(yè)的窗口期,一旦一家足夠強(qiáng)大的AI公司切入到某個(gè)行業(yè),它就能依靠數(shù)據(jù)和積累的行業(yè)經(jīng)驗(yàn),建立起自己的壁壘。

這也是互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代下,AI企業(yè)的競爭力所在:技術(shù)+數(shù)據(jù)。

走出舒適區(qū),面對真實(shí)的市場

“開始很多團(tuán)隊(duì)希望做自己最擅長的事情,最擅長的能做的比較好,團(tuán)隊(duì)也比較舒服,你從算法往芯片或者硬件走,你就得突破自己,走出自己的舒適區(qū),這個(gè)可能是需要對自我的一個(gè)挑戰(zhàn)的?!?/p>

比如AI芯片僅僅強(qiáng)化深度學(xué)習(xí)能力是不夠的,傳感器接入,信號(hào)處理,檢測識(shí)別,以及軟件層面的決策和反饋等,各個(gè)環(huán)節(jié)需要的算法和計(jì)算特性也是不一樣的。

從算法到芯片、硬件,對于很多初創(chuàng)企業(yè)來說,可以算得上是一個(gè)大的跨越,這也是為什么一部分AI公司會(huì)選擇和芯片公司深度合作。因?yàn)橐与x舒適區(qū),就得投入更多的精力,趟過更多的坑。

再就是市場的現(xiàn)狀,不可否認(rèn)天貓精靈賣得很好,但是背后是阿里龐大的資金在做支撐,但無疑這種狀態(tài)不會(huì)持久,當(dāng)這個(gè)生態(tài)去掉大頭后,很多硬件的成本都得面對真實(shí)成本,回到一個(gè)正常的階段。

所以在AI語音芯片落地上,大家更多的還會(huì)將眼光瞄準(zhǔn)整個(gè)物聯(lián)網(wǎng)領(lǐng)域,云知聲黃偉在采訪中就提到,“今天看起來智能音箱起來的量比較多,其實(shí)它是巨頭在拼命的補(bǔ)貼,但那不是真正的市場行為?!?/p>

他提到云知聲做的其他智能語音場景雖不像智能音箱那樣,但縱向?qū)Ρ鹊囊廊挥写蠓鹊脑鲩L。

確實(shí),如果把智能音箱百萬、千萬的量級(jí)放在智能語音市場,只是滄海一粟。在思必馳的高始興來看,智能音箱的量還不能算“爆品”,“我們中國乃至全球的人口,每個(gè)人每個(gè)家庭里都有幾個(gè)智能硬件,在加上一些行業(yè)應(yīng)用場景,最終物聯(lián)網(wǎng)智能硬件的終端會(huì)遠(yuǎn)遠(yuǎn)超過智能手機(jī)?!?/p>

結(jié)語:

在和多位AI語音技術(shù)初創(chuàng)公司采訪的時(shí)候,大家不約而同會(huì)提到,自己并不是PPT造芯,有的表態(tài)已經(jīng)和合作企業(yè)達(dá)成流片;有的表態(tài)芯片已經(jīng)開始規(guī)模化應(yīng)用……在這條賽道上,業(yè)內(nèi)人達(dá)成了共識(shí):市場剛剛開始,遠(yuǎn)遠(yuǎn)沒到競爭的時(shí)候,其實(shí)需要越來越多的公司一塊把市場做大,到那個(gè)時(shí)候再去細(xì)分賽道。

AI語音芯片的熱戰(zhàn)才剛剛開始,對于這些AI語音技術(shù)公司來說,道阻且長,行則將至。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。