當(dāng)我們拿起手機(jī),首先是指紋識(shí)別或人臉識(shí)別解鎖,生物識(shí)別技術(shù)似乎變成了人們生活中的必需品。近兩年,聲紋識(shí)別逐漸被應(yīng)用在一些移動(dòng)支付場(chǎng)景上。
語(yǔ)音和聲紋識(shí)別的區(qū)別
聲紋識(shí)別和語(yǔ)音識(shí)別的技術(shù)原理一致,兩者都是通過(guò)對(duì)采集到的語(yǔ)音信號(hào)進(jìn)行分析和處理,提取相應(yīng)的特征或建立相應(yīng)的模型,然后據(jù)此做出判斷。兩者之間的區(qū)別,主要在于目的及應(yīng)用。簡(jiǎn)單來(lái)說(shuō),語(yǔ)音識(shí)別技術(shù),主要考慮說(shuō)的內(nèi)容是什么,而聲紋識(shí)別則考慮,說(shuō)話(huà)的人是誰(shuí)。
聲紋識(shí)別技術(shù)的基本原理是為每一個(gè)說(shuō)話(huà)人建立聲紋模型,再將語(yǔ)音信號(hào)中說(shuō)話(huà)人的生物參數(shù)(聲音波形)作提取,去除信號(hào)低頻和噪聲部分后與聲紋模型做比對(duì)以確認(rèn)說(shuō)話(huà)人的身份。
聲紋識(shí)別技術(shù)的現(xiàn)狀
聲紋的概念,最早在1945年被提出,到了1966年,自美國(guó)法院開(kāi)始采用“聲紋”取證后,聲紋技術(shù)開(kāi)始被應(yīng)用于司法場(chǎng)景。
有人會(huì)問(wèn),既然聲紋識(shí)別由來(lái)已久,為什么不像指紋識(shí)別或語(yǔ)音識(shí)別一樣被廣泛應(yīng)用?
由于聲紋識(shí)別對(duì)環(huán)境要求較高,考慮實(shí)際商用場(chǎng)景的復(fù)雜性,做身份識(shí)別時(shí)有機(jī)會(huì)出現(xiàn)識(shí)別誤差。舉個(gè)例子,同一個(gè)說(shuō)話(huà)人,在不同時(shí)間中錄制相同的音頻內(nèi)容,有可能因?yàn)榍榫w、身體狀況、說(shuō)話(huà)語(yǔ)速不同等原因,出現(xiàn)不同的聲紋特征。此外,聲紋識(shí)別技術(shù)對(duì)環(huán)境的要求比較高,因?yàn)猷须s的環(huán)境有混淆說(shuō)話(huà)人信息的可能。
不過(guò),由于聲紋識(shí)別具有難以偽造、識(shí)別成本低廉、隱私性弱和不易丟失的優(yōu)勢(shì),被廣泛使用在銀行證券、公安司法、安防及信息防偽領(lǐng)域。
那么,國(guó)內(nèi)掌握聲紋識(shí)別的廠商有哪些,他們技術(shù)來(lái)源又出自哪里呢?國(guó)際電子商情整理了聲紋技術(shù)相關(guān)的廠商,具體如下:

得意音通技術(shù)
成立于2002年成立,北京得意音通技術(shù)有限責(zé)任公司是清華大學(xué)知識(shí)產(chǎn)權(quán)入股的高科技企業(yè)、中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)理事單位、互聯(lián)網(wǎng)金融身份認(rèn)證聯(lián)盟(IFAA)理事單位,是擁有完全自主知識(shí)產(chǎn)權(quán)的聲紋識(shí)別(VPR)、語(yǔ)音識(shí)別(ASR)與中文自然語(yǔ)言處理(CNLP)領(lǐng)域的技術(shù)研發(fā)商、產(chǎn)品開(kāi)發(fā)商和服務(wù)提供商。得意音通在聲紋識(shí)別這一被美國(guó)列為戰(zhàn)略安全技術(shù)的領(lǐng)域居國(guó)際領(lǐng)先地位,可提供高安全、弱隱私、低成本的無(wú)監(jiān)督身份認(rèn)證服務(wù)。
中科信利
北京中科信利技術(shù)有限公司于2002年依托中國(guó)科學(xué)院聲學(xué)研究所合作成立,是以開(kāi)發(fā)智能語(yǔ)音技術(shù)為核心的高新技術(shù)公司。中科信利是國(guó)內(nèi)第一家完全自主研發(fā)并擁有全部自主知識(shí)產(chǎn)權(quán)且實(shí)現(xiàn)了大規(guī)模商用案例的語(yǔ)音識(shí)別技術(shù)公司,是專(zhuān)業(yè)的語(yǔ)音核心技術(shù)和解決方案提供商。
聲智科技
聲智科技主要提供SoundAI Azero交互系統(tǒng)和平臺(tái)服務(wù),以及深度結(jié)合應(yīng)用場(chǎng)景的人工智能技術(shù)和產(chǎn)品解決方案,并擁有聲學(xué)矢量傳感、聲學(xué)陣列芯片、聲學(xué)結(jié)構(gòu)設(shè)計(jì)、遠(yuǎn)場(chǎng)聲學(xué)處理、遠(yuǎn)場(chǎng)語(yǔ)音喚醒、遠(yuǎn)場(chǎng)聲紋識(shí)別、遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別、遠(yuǎn)場(chǎng)雙工通話(huà)、場(chǎng)景語(yǔ)義理解、自然語(yǔ)音合成、超遠(yuǎn)場(chǎng)聲學(xué)監(jiān)控、局部場(chǎng)語(yǔ)音識(shí)別、分布場(chǎng)語(yǔ)音交互、深度學(xué)習(xí)與小樣本學(xué)習(xí)、智能搜索與個(gè)性化推薦等自主核心技術(shù)。
廈門(mén)天聰
廈門(mén)天聰智能軟件有限公司是一家成立于2005年的高新技術(shù)企業(yè)、公安部聲紋識(shí)別行業(yè)標(biāo)準(zhǔn)制定單位,專(zhuān)業(yè)從聲紋識(shí)別、語(yǔ)音技術(shù)和人工智能軟件的研發(fā)和銷(xiāo)售。天聰研發(fā)團(tuán)隊(duì)來(lái)自廈門(mén)大學(xué)、中科院等知名科研院所。 天聰公司是國(guó)內(nèi)專(zhuān)業(yè)的語(yǔ)音聲紋識(shí)別技術(shù)開(kāi)發(fā)商,擁有軟件著作權(quán)6項(xiàng)、授權(quán)和受理專(zhuān)利9項(xiàng)、科技鑒定成果1項(xiàng)、制定聲紋標(biāo)準(zhǔn)1項(xiàng)。
國(guó)音智能(SpeakIn)
廣州國(guó)音智能科技有限公司(SpeakIn),2015年誕生于美國(guó)硅谷,目前總部位于廣州,作為以聲紋識(shí)別等人工智能技術(shù)為核心的行業(yè)綜合方案提供商,面向國(guó)家安全、公共安防、金融及互聯(lián)網(wǎng)等領(lǐng)域提供專(zhuān)業(yè)的科技產(chǎn)品和大數(shù)據(jù)服務(wù)。SpeakIn的團(tuán)隊(duì)核心成員均來(lái)自哈佛大學(xué)、麻省理工學(xué)院、香港科技大學(xué)、香港中文大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、微軟亞洲研究院等國(guó)內(nèi)外頂尖高等學(xué)府和科研機(jī)構(gòu)。
VoiceAI Tech 聲揚(yáng)科技
深圳市聲揚(yáng)科技有限公司(英文簡(jiǎn)稱(chēng)“VoiceAI Tech”),以計(jì)算機(jī)聽(tīng)覺(jué)、大數(shù)據(jù)分析等前沿技術(shù)為核心的國(guó)家高新技術(shù)企業(yè),擁有世界領(lǐng)先的聲紋識(shí)別、語(yǔ)音識(shí)別等人工智能原創(chuàng)技術(shù),可提供安全、高效、穩(wěn)定的身份識(shí)別與智能語(yǔ)音綜合解決方案,可廣泛應(yīng)用在金融、社保、公共安全、政務(wù)、物聯(lián)網(wǎng)、智能硬件等多個(gè)領(lǐng)域。聲揚(yáng)科技的科研團(tuán)隊(duì)具有頂尖學(xué)術(shù)背景豐富,云集來(lái)自香港科技大學(xué)、香港中文大學(xué)、康奈爾大學(xué)、清華大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、復(fù)旦大學(xué)、南開(kāi)大學(xué)等一流院校的科學(xué)家與行業(yè)專(zhuān)家。
