《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > ADI:智能語音大有前途,深度學習/機器學習需先行

ADI:智能語音大有前途,深度學習/機器學習需先行

2017-09-06
關鍵詞: ADI 智能語音

“語音作為交流的方式,如今首先被應用于各種消費設備上作為發(fā)現(xiàn)信息、分享交流的方式、控制環(huán)境的手段。在不久的將來,人機對話必將會應用于各領域,它將成為智能系統(tǒng)的‘耳朵’去聽人說了什么,提供‘大腦’去想人需要或想干什么,提供‘嘴巴’去回應人的需求或操作其他系統(tǒng)。我們現(xiàn)有的客戶已遍布智能家居、安全城市、安全家居、安防、文化娛樂等領域?!?a class="innerlink" href="http://ihrv.cn/tags/ADI" title="ADI" target="_blank">ADI消費產(chǎn)品事業(yè)部市場經(jīng)理Lie Dou如是說。

59aeb150e0117.png

ADI消費產(chǎn)品事業(yè)部市場經(jīng)理Lie Dou

智能語音四面開花,仍需技術先行

當下,智能音箱火熱;未來,我們將坐在沙發(fā)上用聲音遙控電視、空調(diào)、燈具等。智能語音在各個領域的滲透與背后的技術密切相關。

ADI消費產(chǎn)品事業(yè)部語音用戶界面主管Brian Donnelly表示:“智能語音有兩種方案,一種是智能語音算法在系統(tǒng)處理器里面編譯執(zhí)行;另一種是智能語音算法在專門研制的DSP里編譯執(zhí)行?;谥悄苷Z音DSP的方案具有待機功耗低,搭配AP不受限制、選擇性廣, 可有效分擔處理器運算量等優(yōu)點。ADI的基于智能語音DSP的 “Sublime Voice“遠場智能語音識別解決方案已經(jīng)量產(chǎn)。由于在硬件中嵌入了機器學習與深度學習算法,因此可以高效而準確地捕獲語音命令。該解決方案已被國內(nèi)外的客戶設計和應用于機頂盒、條形音箱和電視、智能機器人,智能音箱、住家和辦公樓自動控制、家用白電等產(chǎn)品中。

59aeb09865e3c (1).JPG

ADI消費產(chǎn)品事業(yè)部語音用戶界面主管Brian Donnelly

語音市場火熱的當下,值得思考的是,語音交互與識別在落地的過程中暴露出一些局限性。局限背后有哪些原因呢?又要如何改進呢?

Brian Donnelly提及智能語音的兩個衡量維度是有效率與準確率,有效性是指正確捕捉到“喚醒詞”,準確性是指正確理解和識別語音和命令的意思。而且背后的最大的挑戰(zhàn)來源于在遠場(5-10米)與背景噪音強的應用場景,當然,還存功耗的問題。這需要高品質(zhì)和有效的算法包括對信號聲源的捕捉(DOA)和對環(huán)境噪音的去除。ADI在已有產(chǎn)品與下一代產(chǎn)品中都利用機器學習與深度學習算法加強對語音識別算法的加速。所以ADI 的Sublime Voice方案可以使用較少DSP資源進行復雜的計算。某些場景下,計算效率可高達90%。ADI可在降低系統(tǒng)的功耗的情況下,提高了語音交互識別反應速度,提高系統(tǒng)計算大樣本的能力,提高了語音識別的準確率。

ADI的Sublime Voice 參考設計方案基于4個拾音采樣麥克風可有效地捕捉來自360度方向上的語音指令。它在技術指標上完全達到了7個麥克風產(chǎn)品的水平的同時又使得產(chǎn)品的設計容易達到小型化和拾音麥克風布局的多樣化。

Lie Dou向與非網(wǎng)記者表達了智能語音技術的愿景:我們堅信,智能語音在未來將大展宏圖。它是最自然的人類彼此進行交流互動的方式,也應為我們和我們周圍的電子設備系統(tǒng)交流最自然的方式。我們努力的目標是以更低的功耗實現(xiàn)更強、更優(yōu)化的硬件計算能力,以配合智能化的軟件做更多和更大樣本的計算。這樣可以使智能語音被更快、更廣的推廣到遠場低信噪比的應用場景中去。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。