123,123,123

应对语音交互变革，CEVA“软硬”兼施

日期： 2017-09-07

關(guān)鍵詞： CEVA 语音交互

語音是人類最自然而直接的交互方式，如今恰是從“自然”向“智能”時代跨越的過渡期。在智能語音時代，用戶只需用說話的方式給服務(wù)終端發(fā)布命令，就能得到相應(yīng)的服務(wù)。作為人工智能產(chǎn)業(yè)鏈上的關(guān)鍵一環(huán)，智能語音已在Siri等數(shù)字語音助手、智能家居、車載、可穿戴設(shè)備等域中開始落地。

未來，智能語音必將支持多用戶體驗。比如，不同家庭成員將擁有不同的操作權(quán)限，經(jīng)認證的汽車擁有者借助語音指令，通過智能手表預(yù)啟動汽車等。

除了語音識別，CEVA公司戰(zhàn)略營銷總監(jiān)Moshe Sheier認為語音的魅力不止于此：“我們認為語音識別還將夠勝任更多工作，例如，未來語音識別系統(tǒng)將能夠通過聲音來辨認人(如果在系統(tǒng)中預(yù)先注冊)，了解人們的情緒狀態(tài)，而且無論不受周圍環(huán)境影響而暢順工作。這樣語音識別系統(tǒng)才更人性化，能基于所處位置、喜好以及過往活動等來進判斷操作。這需要對語音識別進行深度擴展——加入‘聲音感測’，除了人聲信息還可識別其它聲音事件，比如家里的門鈴聲和玻璃破碎的聲音，或者道路上緊急車輛的警笛。語音識別和聲音感測的可滲透到生活的每個方面，手機和可穿戴產(chǎn)品的語音激活、智能家居控制、智慧城市安保(聲音事件感測)，汽車、商業(yè)和財務(wù)等領(lǐng)域?！?/p>

CEVA公司戰(zhàn)略營銷總監(jiān)Moshe Sheier

“軟硬”兼施的CEVA語音平臺怎樣的平臺才能稱之為適用于語音應(yīng)用的平臺呢？

回答這個問題，首先需要對應(yīng)用場景進行分類，是電池驅(qū)動還是插座式電源供電、是近場交互操作還是遠場識別。應(yīng)對以上不同場景，便需要兩種不同的解決方案：

第一種是具有超低功耗的近距離交互，使用1至3個麥克風的始終在線語音助手；

第二種是支持4至8個麥克風的高性能遠距離應(yīng)用，可使用多種前端技術(shù)，比如波束成形和多通道回聲消除器。

基于此，CEVA提供CEVA-TeakLite-4 超低功耗 DSP平臺和CEVA-X2高性能DSP平臺解決方案。除了用于語音識別的專用DSP內(nèi)核，還提供應(yīng)用軟件。Moshe Sheier表示，以上兩款方案均有實際應(yīng)用案例，并包含多個CEVA及合作伙伴的軟件包，可實現(xiàn)任何風格的語音助手應(yīng)用。

如何應(yīng)對智能語音痛點盡管技術(shù)先行，但智能語音還存在諸多的挑戰(zhàn)，最大的挑戰(zhàn)便是環(huán)境噪聲，而往往是多個噪聲源錯綜交織——其他人的交談、音樂播放、空調(diào)器和其它機器噪聲、交通噪聲等等。因而，獲得良好的信噪比尤為關(guān)鍵，通過生成清晰的聲音信號來作為語音識別引擎。

應(yīng)對這些挑戰(zhàn)就需要通過降噪、麥克風陣列波束成形、揚聲器跟蹤、回聲消除器、始終聆聽喚醒詞和嵌入式(非基于云端)語音指令等。

Moshe Sheier表示：“CEVA已向全球多個地區(qū)的客戶交付超過60億個音頻/語音芯片，可實現(xiàn)麥克風拾音、降噪、回聲消除和嵌入式語音指令，并將清晰的語音數(shù)據(jù)編碼發(fā)送到云端。我們擁有豐富經(jīng)驗應(yīng)對語音交互的變革。”

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

应对语音交互变革，CEVA“软硬”兼施

日期： 2017-09-07

相關(guān)內(nèi)容