語音識別技術(shù)擁有足夠高的評價,但一直以來缺乏足夠的表現(xiàn)。由于無法精確的識別人類語音的表達,使人們在使用語音識別技術(shù)的時候總會遇上各種各樣的錯誤,結(jié)果就是人們無法通過語音直接打電話和寫短信。不過,這一切都有可能改變,關(guān)鍵詞又是蘋果(Apple)。
蘋果去年 4 月收購一家名為 Siri 的公司,該公司之前推出了一個應(yīng)用,能夠識別人們的語音,針對人們提出的問題進行回答。Siri 所使用的語音識別技術(shù)由在該領(lǐng)域浸淫已久的 Nuance 所開發(fā)的。此后,蘋果與 Nuance 一直保持接觸,并取得了專利授權(quán),現(xiàn)在大家都知道了,蘋果將在 iOS 5 整合名為 Dragon 的語音識別技術(shù)。因此,iOS 5 也許會內(nèi)建語音識別接口(API)供開發(fā)者調(diào)用。
而這,有可能讓蘋果開啟下一扇人機交互的大門。
語音識別技術(shù)已經(jīng)足夠成熟
Dragon 語音識別引擎是相當?shù)某墒欤?iOS 平臺上使用該引擎的 Dragon Dictionary 以極高的識別精確度,效果讓人驚異。而 Android 平臺上由 Nuance 推出的 FlexT9,即使售價為 5 美元都收到 1100 份評論,以及平均 4 顆星的評價??梢娬Z音識別技術(shù)已經(jīng)邁向成熟,能耐得住市場的考驗。
Google 也注意到語音識別技術(shù)的潛力。之前 Google 從 Nuance 中挖來了一位創(chuàng)始人,在 Nuance 工作十年之久的專家。如今用于 Android 上的語音識別技術(shù)被 Slate 評價為“確實可用”。即使拐著彎問的問題也難不倒它,比如說一英里等于多少埃(計量單位 1 埃 = 1.0 × 10 -10 米)這樣。
在手機越變越大,觸控屏越來越流行的情況下,語音識別技術(shù)讓人能夠用一只手來操作手機,提供了方便。至少,有短信來的時候不必痛苦的按虛擬鍵盤,只需要動動嘴巴就行了。
蘋果知道如何讓用戶接受新的操控方式
盡管語音識別技術(shù)已經(jīng)足夠成熟,但未必就能讓如今的手機更加易用。因為新的操作方式等于改變用戶過往的習(xí)慣,這等于用戶過往的經(jīng)驗全不管用。假如手機提供了語音識別功能,但用戶都不去用的話,這項技術(shù)即使再革新也沒有意義。
因此 Nuance 引導(dǎo) FlexT9 的用戶到一系列的視頻教程去,讓用戶明白如何操作。作為反例,Slate 指出 Android 的語音識別技術(shù)不夠人性,用戶需要念出“逗號”、“句號”才能輸入標點符號。
而蘋果能夠讓消費者輕易地接受新的科技:第一個 iPhone 廣告其實是一個教程,消費者從廣告中就學(xué)會如何利用 iPhone 上網(wǎng)、收發(fā)郵件以及搜索附近的商店。最終,消費者接受了觸摸操控,也成就了 iPhone 的輝煌。
如今,語音識別技術(shù)也是一種新的操控方式,而蘋果是去做推廣的廠商。至少蘋果不會只通過枯燥的視頻教程來讓用戶學(xué)會如何用語音來操控手機。
蘋果是用戶體驗大師
一個產(chǎn)品有成熟的技術(shù),和成功的推廣,也未必能夠留住用戶的心。
在 iPhone 之前已經(jīng)有很多款使用觸控屏的手機出現(xiàn)了,但是蘋果的長處就是讓科技變得簡單易用,貼合人性。這使 iPhone 完成了手機的設(shè)計上的革命。現(xiàn)在人們已經(jīng)忘卻了實體鍵盤,忘卻了軌跡球,取而代之的是一整塊觸控屏。
通過深度整合語音識別技術(shù),相信蘋果還能讓變革再一次發(fā)生,至少可以讓人們對著手機說幾句話就能發(fā)一條短信或瀏覽網(wǎng)頁。而對于開發(fā)者來說,語音識別技術(shù)無疑開啟另一扇大門,讓他們的應(yīng)用設(shè)計更具有想象力。
我們?nèi)匀粺o法得知蘋果和 Nuance 合作的具體內(nèi)容,但我們有理由相信蘋果能夠成功的把語音識別技術(shù)帶入移動領(lǐng)域。