隨著AI技術(shù)的深化和計(jì)算機(jī)技術(shù)的發(fā)展,作為人工智能技術(shù)重要分支的智能語(yǔ)音交互技術(shù)也異?;馃?,國(guó)內(nèi)外的IT巨頭紛紛進(jìn)駐語(yǔ)音交互市場(chǎng),既有蘋(píng)果、谷歌、亞馬遜等國(guó)際巨頭,又有百度、阿里、騰訊、搜狗等國(guó)內(nèi)互聯(lián)網(wǎng)巨頭積極布局,同時(shí)還有科大訊飛、思必馳、出門(mén)問(wèn)問(wèn)等專(zhuān)業(yè)語(yǔ)音交互供應(yīng)商,是行業(yè)內(nèi)不可小覷的中堅(jiān)力量。
科大訊飛:為高效記錄代言
語(yǔ)音技術(shù)實(shí)現(xiàn)了人機(jī)語(yǔ)音交互,使人與機(jī)器之間溝通變得像人與人溝通一樣簡(jiǎn)單。作為中國(guó)最大的智能語(yǔ)音技術(shù)提供商,科大訊飛一直專(zhuān)業(yè)從事智能語(yǔ)音及語(yǔ)音技術(shù)研究、軟件及芯片產(chǎn)品開(kāi)發(fā)、語(yǔ)音信息服務(wù),在智能語(yǔ)音技術(shù)領(lǐng)域有著長(zhǎng)期的研究積累,并在中文語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先的成果。
自2006年科大訊飛轉(zhuǎn)寫(xiě)服務(wù)開(kāi)始面世應(yīng)用,到2015年機(jī)器速記準(zhǔn)確率在國(guó)際比賽中首次超越人類(lèi)速記員,再到2018年9月,訊飛在被稱(chēng)為“史上最難語(yǔ)音識(shí)別任務(wù)”的國(guó)際多通道語(yǔ)音分離和識(shí)別大賽(CHiME-5)中包攬全部四個(gè)項(xiàng)目的冠軍,并大幅刷新各項(xiàng)目的最好成績(jī),科大訊飛語(yǔ)音識(shí)別領(lǐng)域一路領(lǐng)跑。
科大訊飛的智能錄音筆一直以來(lái)都在為高效記錄生活代言,今年5月,科大訊飛在上海發(fā)布了 2019 年消費(fèi)級(jí)戰(zhàn)略產(chǎn)品——訊飛智能錄音筆,從此進(jìn)入智能轉(zhuǎn)寫(xiě)時(shí)代。
這款錄音筆具備 2+6 麥克風(fēng)陣列頂級(jí)配置,搭載了訊飛領(lǐng)先的 A.I. 語(yǔ)音識(shí)別和轉(zhuǎn)寫(xiě)引擎,1 小時(shí)錄音 5 分鐘出稿,可以將錄音實(shí)時(shí)轉(zhuǎn)為文字并呈現(xiàn)在機(jī)身自帶的高清屏幕上,并支持要點(diǎn)標(biāo)記、語(yǔ)音搜索、多平臺(tái)同步和后端編輯等創(chuàng)新功能,準(zhǔn)確率高達(dá)到 98%,極大的豐富了錄音筆的功能,是會(huì)議記錄的好幫手。除了中文轉(zhuǎn)寫(xiě),訊飛智能錄音筆同樣支持英文語(yǔ)音的轉(zhuǎn)寫(xiě)和同步輔助翻譯。
訊飛智能錄音筆通過(guò)軟硬件一體化的極簡(jiǎn)設(shè)計(jì)實(shí)現(xiàn)了專(zhuān)業(yè)級(jí)的轉(zhuǎn)錄需求,極大地提升了會(huì)議紀(jì)要、媒體訪談、學(xué)習(xí)培訓(xùn)等場(chǎng)景里信息記錄和內(nèi)容整體的效率,為用戶(hù)提供了極大的便利性,而這個(gè)顛覆式創(chuàng)新的背后,是科大訊飛過(guò)去30年的技術(shù)積累和不斷創(chuàng)新,在核心技術(shù)和創(chuàng)新上,科大訊飛一直很有底氣。
出門(mén)問(wèn)問(wèn):打造最智能AI兒童手表
隨著AI技術(shù)的深化和用戶(hù)普及度的提升,語(yǔ)音交互已經(jīng)從過(guò)去人機(jī)交互中的輔助或補(bǔ)充交互方式,逐漸成為更加主要且獨(dú)立的交互方式,而繼成人智能語(yǔ)音市場(chǎng)后,兒童智能語(yǔ)音市場(chǎng)將成為語(yǔ)音交互的下一個(gè)爆點(diǎn)市場(chǎng)。
但是目前市場(chǎng)上已有的兒童語(yǔ)音成長(zhǎng)陪伴類(lèi)產(chǎn)品,像包括智能手機(jī)、兒童手表、智能學(xué)習(xí)機(jī)等,還存在一些缺陷。相比成人而言,兒童在發(fā)音方式、理解能力方面存在很大的差異,例如在語(yǔ)音喚醒和識(shí)別上,沒(méi)有針對(duì)兒童發(fā)音特點(diǎn)進(jìn)行專(zhuān)門(mén)模型訓(xùn)練,導(dǎo)致語(yǔ)音喚醒不靈敏、識(shí)別不準(zhǔn)確;知識(shí)圖譜不夠健全等,無(wú)法提供足夠廣泛的知識(shí)、游戲和互動(dòng),不能維持兒童的交互興趣等,這些都是兒童語(yǔ)音交互產(chǎn)品需要解決的技術(shù)難點(diǎn)。成立不到7年的出門(mén)問(wèn)問(wèn)將目光瞄準(zhǔn)了這個(gè)潛力巨大的市場(chǎng),并且很好的解決這些難點(diǎn),成功脫穎而出。
出門(mén)問(wèn)問(wèn)是Google(谷歌)投資的一家中國(guó)人工智能公司,自成立以來(lái),出門(mén)問(wèn)問(wèn)致力于以人工智能為中心,通過(guò)軟硬結(jié)合產(chǎn)品落地到生活場(chǎng)景,來(lái)打造下一代的人機(jī)交互方式。其代表性的軟硬結(jié)合產(chǎn)品——智能手表Ticwatch,搭載自主研發(fā)的Ticwear操作系統(tǒng),是出門(mén)問(wèn)問(wèn)人工智能技術(shù)成功落地的一款可穿戴設(shè)備,是中國(guó)智能手表里程碑式產(chǎn)品,并成為屏占比最高及第一個(gè)獲得MFi(Made for iPhone)認(rèn)證的智能手表。2016年6月發(fā)布Ticwatch 2,裝入了超過(guò)500個(gè)精密元器件,更開(kāi)創(chuàng)性通過(guò)內(nèi)置貼片式SIM芯片實(shí)現(xiàn)3G通訊,成為全球第一個(gè)支持GPS、3G、公交卡和銀行卡支付的智能手表。
憑借人工智能技術(shù)的積累和端到端的產(chǎn)品解決能力,今年5月,出門(mén)問(wèn)問(wèn)推出全新的AI兒童手表TicWatch Kids,集成了出門(mén)問(wèn)問(wèn)業(yè)界領(lǐng)先的中文神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成技術(shù)(Neural TTS),可提供接近真人童聲的播報(bào)聲音,極大提高了兒童進(jìn)行語(yǔ)音交互的舒適度與積極性。同時(shí),基于海量真人童聲語(yǔ)料,以及深度學(xué)習(xí)與知識(shí)圖譜的融合策略,實(shí)現(xiàn)了低延遲、高準(zhǔn)確率的語(yǔ)音識(shí)別、語(yǔ)意理解和高彈性多輪語(yǔ)音交互,對(duì)孩子的問(wèn)題給出有趣、正向、準(zhǔn)確的回答,并能夠基于敏感詞篩查和可靠數(shù)據(jù)源技術(shù)自動(dòng)過(guò)濾負(fù)面敏感內(nèi)容,為孩子提供健康的學(xué)習(xí)成長(zhǎng)環(huán)境,成為兒童智能語(yǔ)音市場(chǎng)中最有競(jìng)爭(zhēng)力的一款A(yù)I產(chǎn)品。
思必馳:智能語(yǔ)音行業(yè)新秀領(lǐng)軍企業(yè)
成立于英國(guó)劍橋高新區(qū)的思必馳,一直致力于自然語(yǔ)言人機(jī)交互的移動(dòng)互聯(lián)網(wǎng)公司,擁有自主知識(shí)產(chǎn)權(quán)的人機(jī)對(duì)話(huà)、語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成、聲紋識(shí)別等綜合語(yǔ)音技術(shù),人機(jī)對(duì)話(huà)和語(yǔ)音識(shí)別性能處于業(yè)界領(lǐng)先水平。思必馳創(chuàng)始人高始興和俞凱均來(lái)自劍橋大學(xué),兩人當(dāng)時(shí)一拍即合,于2007年在英國(guó)劍橋成立思必馳,2008年回國(guó)落戶(hù)蘇州,是中國(guó)智能語(yǔ)音行業(yè)新秀領(lǐng)軍企業(yè)。
在智能終端市場(chǎng),思必馳自主研發(fā)了對(duì)話(huà)操作系統(tǒng)(DUI)和人工智能芯片(Taihang),面向各類(lèi)終端場(chǎng)景,開(kāi)發(fā)了系列軟硬一體化的Turnkey方案,是國(guó)內(nèi)極少數(shù)擁有原始創(chuàng)新能力和基礎(chǔ)創(chuàng)新團(tuán)隊(duì)支撐的AI公司。
2014年,亞馬遜的智能音箱Echo的爆紅掀起了國(guó)內(nèi)智能音箱的熱潮,而語(yǔ)音交互是智能音箱最關(guān)鍵的功能,思必馳看準(zhǔn)市場(chǎng)轉(zhuǎn)型入局智能終端領(lǐng)域,在智能音箱上取得了巨大的成功。以BAT為代表的互聯(lián)網(wǎng)巨頭紛紛進(jìn)入,推出諸如天貓精靈、小米小愛(ài)同學(xué)等諸多爆款,而這些爆款智能音箱,均采用思必馳的語(yǔ)音交互方案。
十多年來(lái),思必馳一直保持著低調(diào),專(zhuān)注于技術(shù)能力的提升。今年1月,思必馳發(fā)布AI芯片——深聰TAIHANG芯片(TH1520),基于雙DSP架構(gòu),內(nèi)部集成codec編解碼器以及大容量的內(nèi)置存儲(chǔ)單元;采用AI指令集擴(kuò)展和算法硬件加速的方式,使其相較于傳統(tǒng)通用芯片具有10X以上的效率提升,此外,TH1520在架構(gòu)上具有算力及存儲(chǔ)資源的靈活性,支持未來(lái)算法的升級(jí)和擴(kuò)展。
思想必將馳騁,相信思必馳憑借著自由獨(dú)立的思想,必將馳騁在智能語(yǔ)音交互這片前景十分寬廣的領(lǐng)域。
智能語(yǔ)音:智能家居的入口
在智能家居興起之際,作為串聯(lián)智能家居設(shè)備的入口,智能語(yǔ)音助手也快速崛起。不管是智能語(yǔ)音助手,還是搭載了智能語(yǔ)音助手的智能音箱,都是依靠智能語(yǔ)音識(shí)別技術(shù)發(fā)展而來(lái)。鑒于語(yǔ)音助手在智能家居設(shè)備連通方面的顯著優(yōu)勢(shì)和其廣闊的應(yīng)用空間,國(guó)內(nèi)外巨頭都將智能語(yǔ)音助手作為了布局的重點(diǎn)對(duì)象,并加快布局語(yǔ)音助手。
作為專(zhuān)業(yè)語(yǔ)音交互供應(yīng)商,科大訊飛、思必馳都有良好的語(yǔ)音識(shí)別技術(shù)基礎(chǔ),并且都有意發(fā)展智能家居業(yè)務(wù)。近日,科大訊飛與國(guó)美達(dá)成深度合作,聯(lián)合打造的國(guó)美智能空調(diào),通過(guò)搭載訊飛智能語(yǔ)音解決方案,實(shí)現(xiàn)喚醒、離線識(shí)別、合成播報(bào)一系列完整語(yǔ)音交互功能;思必馳很早就做了轉(zhuǎn)型并在智能音箱上取得了巨大的成功,在智能音箱領(lǐng)域市場(chǎng)占有率第一,并且在智能家居市場(chǎng)與長(zhǎng)虹、美的、美菱、海信、海爾、云米等達(dá)成合作,是中國(guó)物聯(lián)網(wǎng)領(lǐng)域市場(chǎng)增長(zhǎng)最快的人工智能公司。
隨著智能家居的發(fā)展,智能語(yǔ)音交互也將迎來(lái)大爆發(fā),這種創(chuàng)新的人機(jī)交互方式也將極大地推動(dòng)物聯(lián)網(wǎng)的落地,相信智能語(yǔ)音交互領(lǐng)域未來(lái)的發(fā)展前景可期。