《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 谷歌前工程師開(kāi)發(fā)實(shí)時(shí)語(yǔ)音APP AI迎來(lái)又一大突破

谷歌前工程師開(kāi)發(fā)實(shí)時(shí)語(yǔ)音APP AI迎來(lái)又一大突破

2018-03-08
關(guān)鍵詞: iOS 亞馬遜 谷歌 智能

1520395247255070264.jpg

在2018年移動(dòng)世界大會(huì)上擁有三層展臺(tái)的數(shù)十億美元技術(shù)巨頭中,有一對(duì)企業(yè)家在談?wù)撊斯?a class="innerlink" href="http://ihrv.cn/tags/智能" title="智能" target="_blank">智能方面的突破,他們剛剛把一款名為Otter.a(chǎn)i的新應(yīng)用程序在iOS和Android中推出。

當(dāng)他們坐下來(lái)在Fira Barcelona 2號(hào)展廳后角的一個(gè)小會(huì)議室里談?wù)摃r(shí),Sam Liang將他的iPhone放在桌子上,并點(diǎn)擊了Otter應(yīng)用程序中的記錄按鈕。作為Otter.a(chǎn)i背后公司Alexense的首席執(zhí)行官,Liang開(kāi)始講述了加州15人創(chuàng)業(yè)小公司如何采用不同的方法來(lái)理解音頻數(shù)據(jù),不同于亞馬遜Alexa,谷歌助理和其他公司在語(yǔ)音識(shí)別上的努力。

在Liang發(fā)表講話時(shí),Otter開(kāi)始吐文,大概延遲了2-3秒。而且,由于Liang事先在應(yīng)用程序中設(shè)置了會(huì)議,所以當(dāng)他的隊(duì)友Seamus McAteer提出自己的評(píng)論時(shí),軟件會(huì)自動(dòng)識(shí)別,或者會(huì)因其他人的后續(xù)問(wèn)題而中斷。

盡管Otter的自然語(yǔ)言處理方式并不完美,標(biāo)點(diǎn)缺失,詞語(yǔ)被誤解,說(shuō)話人有時(shí)被錯(cuò)誤識(shí)別,但它已經(jīng)非常接近了,特別是考慮到速度和應(yīng)用程序是免費(fèi)的。

1520395247292063056.jpg

“我們的技術(shù)完全不同。” Liang在接受ZDNet采訪時(shí)說(shuō)。 “我們稱之為'Ambient Voice Intelligence'(環(huán)境聲音智能),我們使用ambient這個(gè)詞來(lái)表示這是在后臺(tái)工作......你的大腦只能記住10-20%的(會(huì)議)信息......所以我們認(rèn)為我們可以幫助人們捕獲這些信息,然后快速搜索?!?/p>

搜索是最好的功能。錄制完成后,應(yīng)用程序的機(jī)器學(xué)習(xí)會(huì)自動(dòng)創(chuàng)建約10個(gè)關(guān)鍵字,以便用戶了解會(huì)議的內(nèi)容。你可以馬上開(kāi)始搜索全文。同樣有用的是,一旦你熟悉關(guān)鍵字,可以點(diǎn)擊播放按鈕來(lái)收聽(tīng)發(fā)生的音頻部分。

該應(yīng)用程序的下一個(gè)最佳功能是可以共享記錄的會(huì)議。所以,如果你有一個(gè)會(huì)議,而一個(gè)同事不能參加,你可以隨后向他們發(fā)送記錄和音頻,以便他們找到與之相關(guān)的東西。

如果你將谷歌帳戶連接到應(yīng)用并導(dǎo)入聯(lián)系人,那么所有這些高級(jí)功能都是非常簡(jiǎn)單的。因此,如果你的企業(yè)使用Google Apps,它可以非常順利地運(yùn)行。跟谷歌的整合并不令人意外,因?yàn)長(zhǎng)iang是谷歌前工程師。

McAteer從事移動(dòng)和數(shù)據(jù)分析工作已有20多年。團(tuán)隊(duì)的其他成員由前谷歌,F(xiàn)acebook,雅虎和Nuance員工以及麻省理工學(xué)院、斯坦福大學(xué)和其他頂尖科技計(jì)劃的博士和計(jì)算機(jī)科學(xué)家組成。

自2016年1月起,該團(tuán)隊(duì)一直致力于研究Otter背后的技術(shù)。他們擁有在過(guò)去一年中授權(quán)給其他合作伙伴的API - 主要是在錄制完成后提供音頻文件的轉(zhuǎn)錄。 AISense利用所有的合作伙伴數(shù)據(jù)來(lái)調(diào)整和訓(xùn)練算法。

今年1月,他們宣布與快速增長(zhǎng)的視頻會(huì)議服務(wù)公司Zoom簽署了一項(xiàng)許可合作伙伴關(guān)系,現(xiàn)在該公司提供了一個(gè)錄制視頻會(huì)議的選項(xiàng)——由AISense提供支持。

隨著推出實(shí)時(shí)錄音的免費(fèi)應(yīng)用程序,該公司正在進(jìn)入下一個(gè)階段。它最終計(jì)劃推出其應(yīng)用程序的高級(jí)版本,該版本將建立在免費(fèi)版本的功能上。例如,免費(fèi)版本將允許你搜索過(guò)去90天的會(huì)議。高級(jí)版本將進(jìn)一步擴(kuò)大。

“能夠記住,搜索和分享你的語(yǔ)音對(duì)話是合作的下一個(gè)前沿?!?Liang說(shuō),“Otter授權(quán)用戶使用AI進(jìn)行日常對(duì)話,因此他們可以專注于所說(shuō)的內(nèi)容而忘記記筆記?!?/p>

可以在Otter.a(chǎn)i,Apple App Store和Google Play Store找到該應(yīng)用程序。 iOS版本在這一點(diǎn)上更加精細(xì)一些,但都值得關(guān)注這款應(yīng)用程序隨著時(shí)間的推移如何發(fā)展和提高。

IBM Watson提供實(shí)時(shí)的文本到語(yǔ)音服務(wù),但它背靠超級(jí)計(jì)算機(jī)。因此,AISense使用應(yīng)用程序和智能手機(jī)取得了令人印象深刻的成就,而且它可以說(shuō)是2018年世界移動(dòng)通信大會(huì)上宣布的最重要突破之一 ,盡管它一直以來(lái)十分低調(diào)。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。