《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 3D手勢(shì)辨識(shí)進(jìn)軍電視遙控領(lǐng)域
3D手勢(shì)辨識(shí)進(jìn)軍電視遙控領(lǐng)域
摘要: 基于微機(jī)電(MEMS)技術(shù)的3D手勢(shì)辨識(shí)技術(shù)正大幅擴(kuò)展其在智慧手機(jī)和電視遙控器領(lǐng)域的應(yīng)用,而不再僅限于最初的兒童游戲了。
Abstract:
Key words :

 

    基于微機(jī)電(MEMS)技術(shù)的3D手勢(shì)辨識(shí)技術(shù)正大幅擴(kuò)展其在智慧手機(jī)和電視遙控器領(lǐng)域的應(yīng)用,而不再僅限于最初的兒童游戲了。

    今年可說是3D手勢(shì)辨識(shí)技術(shù)突破傳統(tǒng)在一般游戲應(yīng)用框架的一年。從最初作為任天堂(Nintendo) Wii的無線游戲介面首次出現(xiàn)在消費(fèi)市場(chǎng)后,歷經(jīng)數(shù)年的發(fā)展,基于MEMS 感測(cè)器的手勢(shì)辨識(shí)技術(shù)已將觸角延伸到了智慧手機(jī),并準(zhǔn)備搶占最具有象征性的消費(fèi)者介面:電視遙控器。

    自從Wii于2006年問世后,任天堂公司的競(jìng)爭(zhēng)對(duì)手們都紛紛開發(fā)出各自的3D手勢(shì)辨識(shí)和處理技術(shù)。Sony公司專為追逐高精確度控制的游戲玩家們開發(fā)出Move Playstation所用的動(dòng)態(tài)控制器;微軟(Microsoft)則以Xbox Kinect實(shí)現(xiàn)游戲介面的免持功能。

    蘋果(Apple)率先利用MEMS感測(cè)器的潛能,成功地打造出更直觀的智慧手機(jī)介面,并于2007年在iPhone中增加了MEMS加速度計(jì),2010年又增加了MEMS 陀螺儀。蘋果公司的競(jìng)爭(zhēng)對(duì)手們緊隨其后,很快地,各種3D指令(如以搖動(dòng)表示取消、提起表示接聽,以及反轉(zhuǎn)手機(jī)表示斷線)將成為標(biāo)準(zhǔn)的智慧手機(jī)功能。

    而今,消費(fèi)OEM們正為其產(chǎn)品線中增加3D手勢(shì)辨識(shí)功能。有些公司使用GestureTek公司的相機(jī)技術(shù)授權(quán),其它公司則取得Hillcrest Laboratories公司或Movea公司的MEMS技術(shù)授權(quán)。Movea公司擁有250多項(xiàng)相關(guān)專利,涵蓋像使用陀螺儀控制游標(biāo)之類的技術(shù);Hillcrest公司擁有100多項(xiàng)專利,包括使用加速度計(jì)和陀螺儀以追蹤動(dòng)作的專利。這兩家公司都為3D手勢(shì)設(shè)計(jì)者提供了加值的軟體開發(fā)工具──分別是Movea公司的Gesture Builder和Hillcrest公司的Freespace MotionStudio。

    谷歌(Google)方面則是在代號(hào)為'姜餅'(Gingerbread)的Andr??oid作業(yè)系統(tǒng)中增加了基于MEMS的手勢(shì)辨識(shí)應(yīng)用程式介面,以便能夠辨識(shí)諸如傾斜、旋轉(zhuǎn)、插入和切削等動(dòng)作。

    “動(dòng)作處理終將受到主流消費(fèi)者的廣泛接受,”InvenSense公司創(chuàng)始人Steve Nasiri表示,“我們預(yù)測(cè)用于動(dòng)作處理和手勢(shì)辨識(shí)的硬體將像會(huì)變得像照相機(jī)模組一樣,廣泛地應(yīng)用在智慧手機(jī)中。”InvenSense公司是首家在單一晶片上整合加速度計(jì)和陀螺儀的MEMS晶片制造商。

    InvenSense在其陀螺儀以及加速度計(jì)/陀螺儀整合晶片中嵌入一個(gè)動(dòng)作處理器,以執(zhí)行辨識(shí)用戶手勢(shì)時(shí)必要的復(fù)雜感測(cè)器融合演算法,同時(shí)減輕應(yīng)用處理器的任務(wù)負(fù)載。InvenSense公司計(jì)劃明年將在單一晶片上整合加速度計(jì)、陀螺儀和磁力計(jì)(電子羅盤)。

    在國際消費(fèi)電子展(CES)上,InvenSense公司的動(dòng)作處理資料庫首次出現(xiàn)于電視遙控器和智慧手機(jī)中──使電視遙控器可控制3D手勢(shì)辨識(shí),并以智慧手機(jī)實(shí)現(xiàn)基本電話功能(如只需將手機(jī)拿起來靠近耳朵就能接聽電話)。這兩種產(chǎn)品都是LG Electronics公司的產(chǎn)品─??─Magic Motion遙控器用于LG Infinia系列3D電視機(jī);而LG公司新款僅9.2mm寬的Optimus Black智慧手機(jī)據(jù)稱是全球最薄的智慧手機(jī),可辨識(shí)多種獨(dú)特的手勢(shì)指令。

    其它MEMS晶片制造商同樣將手勢(shì)辨識(shí)演算法整合于其加速度計(jì)與陀螺儀產(chǎn)品中。例如,Kionix公司提供數(shù)十種內(nèi)建手勢(shì)辨識(shí)演算法的產(chǎn)品系列,該公司的Gesture Designer軟體開發(fā)套件也能協(xié)助OEM設(shè)計(jì)出客制化的手勢(shì)控制效果。

    “電視遙控器公司們正在努力將手勢(shì)辨識(shí)技術(shù)整合于其產(chǎn)品中,這需要利用非常先進(jìn)復(fù)雜的動(dòng)作控制技術(shù)。”Kionix公司CEO Greg Galvin指出,“其精華是將視聽輸入功能融合于電視機(jī)中,讓用戶可透過一個(gè)遙控器切換頻道、下載音樂、欣賞照片集或圖庫、進(jìn)行文字處理或?yàn)g覽網(wǎng)際網(wǎng)路。”

    在IPTV上執(zhí)行應(yīng)用程式和瀏覽網(wǎng)路內(nèi)容時(shí),遙控器必須具備像滑鼠一樣的精確度,才能實(shí)現(xiàn)點(diǎn)選和基于手勢(shì)的控制功能。“這些應(yīng)用確實(shí)需要利用MEMS技術(shù)。”Galvin表示。

智慧電視元年

    Hillcrest公司創(chuàng)始人兼CEO Dan Simpkins認(rèn)為,2011年是'智慧電視元年',并補(bǔ)充道,“50多年來,電視市場(chǎng)終于首次迎來了一種全新的輸入技術(shù)。”Hillcrest公司開發(fā)出一種空中滑鼠──Loop指向器,專門針對(duì)那些想要將電腦與電視機(jī)連接起來的消費(fèi)者而設(shè)計(jì);同時(shí),該公司并為IPTV開發(fā)出一款Kylo瀏覽器。

   LG公司在CES上展示的Magic Motion遙控器使用的是Hillcrest公司的Freespace手勢(shì)辨識(shí)技術(shù),可讓助用戶透過復(fù)雜的點(diǎn)選螢?zāi)唤槊鏋g覽網(wǎng)路和傳統(tǒng)電視內(nèi)容。

    其它競(jìng)爭(zhēng)技術(shù)還包括飛利浦(Philips)公司的uWand。飛利浦的掌上型控制器選用整合式紅外線攝影機(jī)檢測(cè)電視機(jī)發(fā)出的紅外光,無需采用陀螺儀就能實(shí)現(xiàn)精確的動(dòng)作追蹤。但大多數(shù)其它IPTV遙控器使用的是MEMS陀螺儀。

   例如,Movea公司在CES上宣布,臺(tái)灣筆記型電腦鍵盤供應(yīng)商精元電腦(Sunrex)公司今年稍晚即將推出的控制器產(chǎn)品中,將會(huì)使用Movea公司基于MEMS的MotionIC平臺(tái)以及SmartMotion技術(shù),以實(shí)現(xiàn)3D手勢(shì)辨識(shí)。

   “下一代動(dòng)作遙控器將能辨識(shí)所有種類的新手勢(shì)。”Movea公司全球行銷經(jīng)理Dave Rothenberg表示,“例如,父母透過在空中揮動(dòng)簽名手勢(shì),即可解鎖電視中的成人內(nèi)容,而當(dāng)小孩走進(jìn)房內(nèi)時(shí)再以相同的動(dòng)作來啟動(dòng)監(jiān)護(hù)控制功能。”

    同時(shí),微軟公司的Kinect控制器也為傳統(tǒng)智慧帶來了挑戰(zhàn)。這款內(nèi)建MEMS加速度計(jì)的Kinect控制器可置于設(shè)備頭端,使用戶的手得以完全擺脫手勢(shì)感測(cè)硬體。微軟根據(jù)由GestureTek公司所授權(quán)而來光學(xué)辨識(shí)技術(shù),為Kinect開發(fā)了專有的3D辨識(shí)演算法。

    Kinect控制器為特定游戲(如虛擬排球)界定嚴(yán)格的動(dòng)作范圍,并進(jìn)行分類。該技術(shù)以雷射將一組規(guī)則的紅外線點(diǎn)陣投射到玩家身上,而對(duì)所投射的影像進(jìn)行分段,然后測(cè)量每個(gè)點(diǎn)的反射強(qiáng)度。強(qiáng)度較低的反射點(diǎn)被設(shè)定為來自于背景反射,而較強(qiáng)的反射點(diǎn)則被設(shè)定為從前景中的用戶身上反射而來。然后,Kinect再為用戶的動(dòng)作進(jìn)行最佳推測(cè)分析,以驅(qū)動(dòng)游戲中的化身進(jìn)行反應(yīng)與動(dòng)作。Kionix公司的MEMS加速度計(jì)則有助于使攝影鏡頭能更精確地對(duì)準(zhǔn)用戶。

    根據(jù)業(yè)界分析師們表示,這種技術(shù)犧牲了一定的精確度,以利于用戶的行動(dòng)性。“我認(rèn)為微軟公司基于攝影機(jī)的辨識(shí)系統(tǒng)所具備的精確度仍不足以滿足眾多游戲玩家的要求,這可能導(dǎo)致他們?nèi)匀粚幙衫^續(xù)使用手持控制器,從而讓Sony的Move成為游戲玩家的更佳選擇。 ”iSuppli公司資深分析師Jeremie Bouchaud指出。

    “微軟解決方案適合其所針對(duì)的用戶:例如想要快速進(jìn)入和離開游戲、以及希望擁有方便且即時(shí)體驗(yàn)的家庭。”IHS Screen Digest公司游戲負(fù)責(zé)人Piers Harding-Rolls表示。“另一方面,Sony的Move是一種混合解決方案,不但以感測(cè)器追蹤動(dòng)作,也使用攝影機(jī)追蹤位置。在目前這個(gè)階段中,Sony的論點(diǎn)是為游戲玩家提供更精確的感測(cè)器技術(shù)。 ”

    像Kinect控制器這類以攝影機(jī)為基礎(chǔ)的技術(shù),“并不是手勢(shì)辨識(shí)的終結(jié)者。它有一定的存在空間,但加速度計(jì)/陀螺儀組合也有自己的市場(chǎng)空間。”Gartner公司分析師Jim Tully認(rèn)為。

   “例如,Kinect攝影機(jī)鏡頭無法在多用戶場(chǎng)合中檢測(cè)一連串復(fù)雜的動(dòng)作,特別是當(dāng)某一位用戶被另一位用戶擋住,以及當(dāng)用戶背對(duì)著攝影機(jī)鏡頭時(shí)的效果都不好……這些時(shí)候就需要多部攝影機(jī),然而,這在大多數(shù)情況下又不見得可行。”

    透過觀察不斷變化中的攝影影像,GestureTeck公司的技術(shù)已經(jīng)追蹤了數(shù)百萬部手機(jī)的3D動(dòng)作。該公司并因此宣稱,這一光學(xué)手勢(shì)辨識(shí)技術(shù)最終將戰(zhàn)勝基于MEMS的設(shè)備。

    “至今,光學(xué)手勢(shì)辨識(shí)技術(shù)的解析度和精確度仍無法達(dá)到像使用MEMS慣性感測(cè)器時(shí)的效果,但對(duì)于大多數(shù)游戲來說已經(jīng)足夠了。”GestureTek公司共同創(chuàng)辦人兼總裁Vincent John Vincent指出,“同時(shí),隨著攝影機(jī)鏡頭解析度的不斷提升,我們深信光學(xué)手勢(shì)辨識(shí)將具有更精確的解析度,讓設(shè)備得以追蹤身體每部分的動(dòng)作,最終還將超越MEMS技術(shù)。”

   手勢(shì)辨識(shí)領(lǐng)域中的'凱迪拉克'

    就像游戲玩家十分看重精確度一樣,游戲本身的重要性也不如游戲的開發(fā)或特效電影動(dòng)畫一般。對(duì)于動(dòng)畫達(dá)人來說,手勢(shì)辨識(shí)領(lǐng)域中的'凱迪拉克'就是Xsens Technologies公司以MEMS元件鑲嵌打造的緊身衣褲。這種套裝上的加速度計(jì)和陀螺儀可實(shí)現(xiàn)即時(shí)的動(dòng)畫序列預(yù)覽。

    Xsens公司利用美商亞德諾(ADI)公司的高精度三軸加速度計(jì)、陀螺儀和磁力計(jì),開發(fā)出精細(xì)的動(dòng)態(tài)追蹤。例如,有些專業(yè)設(shè)計(jì)者利用Xsens技術(shù)為電影'鋼鐵人2'(Iron Man 2)和PS3游戲'殺戮地??帶2'(KillZone 2)開發(fā)動(dòng)畫效果。這種技術(shù)提供的動(dòng)作擷取解決方案可應(yīng)用于任何場(chǎng)合,而無需復(fù)雜的基礎(chǔ)設(shè)施。Xsens公司預(yù)測(cè),這種技術(shù)最終將能使消費(fèi)應(yīng)用降低成本,實(shí)現(xiàn)類似Kinect的體驗(yàn),但提供較其更高的精確度,玩家人數(shù)多少也不受限制。

    “微軟Kinect是一種優(yōu)質(zhì)的解決方案,因?yàn)樗恍枰谌梭w上安裝任何感測(cè)器,不過,這也使其速度較慢,有時(shí)在追蹤人類動(dòng)作姿勢(shì)方面顯得比較遲緩。”Xsens公司CEO Casper Peeters表示,“我們的技術(shù)應(yīng)用場(chǎng)合方面則靈活得多,它在追蹤穿戴者的細(xì)致動(dòng)作中可以達(dá)到更高的精確度。但基于動(dòng)作的游戲控制器和電話介面才剛開始出現(xiàn)。Xsens公司期望朝另一方面發(fā)展,針對(duì)細(xì)致的人物動(dòng)畫實(shí)現(xiàn)高階動(dòng)態(tài)擷取,并為未來催生更多有趣的應(yīng)用。”

    微軟也將目光瞄準(zhǔn)了未來,計(jì)劃充分利用該公司分別于2009年和2010年收購3-DV和Canesta公司時(shí)所取得的3D追蹤技術(shù)。這些公司在時(shí)差測(cè)距(TOF)手勢(shì)辨識(shí)專利方面實(shí)際上已壟斷了市場(chǎng),特別是對(duì)行動(dòng)設(shè)備而言。

    時(shí)差測(cè)距感測(cè)器所測(cè)量的是紅外線從物體反射回來到達(dá)某個(gè)特定CMOS感測(cè)器的時(shí)間,從而實(shí)現(xiàn)可在任何光照條件下任意距離的高精確度3D深度映射。時(shí)差測(cè)距深度映射技術(shù)還能??與微軟獲GestureTek授權(quán)開發(fā)的3D攝影機(jī)手勢(shì)辨識(shí)演算法完美地結(jié)合起來。

    德國TriDiCam和其他幾家公司聲稱也擁有時(shí)差測(cè)距感測(cè)器技術(shù)。但至今只有Canesta公司證實(shí)了這個(gè)概念,可以使用一個(gè)CMOS影像感測(cè)器作出在行動(dòng)設(shè)備上方僅數(shù)英吋處揮手的精確3D影像映射,即使在室外明亮的陽光下使用也沒問題。

    同時(shí),像Silicon Labs等公司則利用低成本的紅外線和環(huán)境光感測(cè)器,以辨識(shí)特殊應(yīng)用手勢(shì),例如以手指在空中劃一條線來啟動(dòng)顯示器或調(diào)整音量。

Surface的變化

    微軟在CES上展示了下一代Surface多點(diǎn)觸控平臺(tái)。這種平臺(tái)不再使用第一代產(chǎn)品中的5架攝影機(jī)建置,實(shí)現(xiàn)了一種可垂直安裝的更輕薄設(shè)備。

   這種Surface平臺(tái)讓用戶能直接操作顯示在螢?zāi)簧系奈矬w,并內(nèi)建演算法來解讀各種手勢(shì),如選擇、拖拉、放下、單指縮放(pinch-to-zoom)和其它類似觸控螢?zāi)坏闹噶?OEM還可開發(fā)自建演算法)。該新版本“厚度僅4英吋,能以水平、垂直或任何角度進(jìn)行安裝。”微軟公司Surface開發(fā)團(tuán)隊(duì)總經(jīng)理Brad Carpenter指出。

    Surface平臺(tái)的關(guān)鍵在于微軟與三星LCD部門共同開發(fā)的PixelSense技術(shù)。該技術(shù)針對(duì)交錯(cuò)式棋盤圖案的可見光或紅外光,為其中的每個(gè)LCD畫素都加入一個(gè)光感測(cè)器。在背光中的可見光和紅外光發(fā)射器讓每個(gè)對(duì)應(yīng)畫素能偵測(cè)到從使用者雙手或其它物體反射的光線,再以60f/s的速度采樣感測(cè)器,即可同時(shí)追蹤多位用戶的動(dòng)作,使用者數(shù)量僅受限于螢?zāi)豢捎玫谋砻娣e空間大小。內(nèi)建的FPGA支援定位追蹤,并能讀取在螢?zāi)槐砻嫔戏胖梦矬w上的特殊應(yīng)用標(biāo)簽,再透過紅外線傳輸方式將資料傳送到配備攝影機(jī)的Windows 7智慧手機(jī)上。

    在應(yīng)用程式方面,Surface平臺(tái)包括支援Windows 7的超微(AMD) Athlon X2 245e 2.9GHz雙核心處理器,以及一個(gè)與其搭配的AMD Radeon HD 6750繪圖處理器。

    三星公司還將采用此技術(shù)推出型號(hào)為SUR40的顯示器,“這種40英吋的螢?zāi)粚⒂扇堑腖CD部門以7,600美元的價(jià)格銷售至全球市場(chǎng)。”微軟公司的Carpenter透露。

圖說:蘋果用戶們非常熟悉2D手勢(shì)控制,包括像單指縮放等指令都已經(jīng)被電腦和智慧手機(jī)領(lǐng)域的競(jìng)爭(zhēng)對(duì)手們復(fù)制。

圖說:穿戴著Xsens公司MVN Motion Capture彈性纖維緊身衣的演員(中)──這件萊卡材質(zhì)的緊身衣鑲嵌著ADI公司的MEMS慣性感測(cè)器。他模擬美國驚奇漫畫(Marvel Comics)公司'鋼鐵人'漫畫插圖中的人物姿態(tài)(左),以作為派拉蒙電影(Paramount Picture)公司創(chuàng)作“鋼鐵人2”(右)電影動(dòng)畫的基礎(chǔ)。

資料來源:Marvel、Xsens、Paramount

圖說:飛利浦公司的uWand技術(shù)針對(duì)與配備MEMS控制器相同的應(yīng)用,但不使用MEMS元件。相反地??,它整合了一個(gè)紅外線攝影機(jī)以偵測(cè)來自電視的紅外光,因此不用陀螺儀就能實(shí)現(xiàn)動(dòng)作追蹤。

資料來源:飛利浦

(紅外線光束,紅外線感測(cè)器,游標(biāo)+按鍵透過RF到接收器)

圖說:在OEM演算法的支援下,微軟Surface平臺(tái)可讀取'揮手'動(dòng)作。重新設(shè)計(jì)過的螢?zāi)幻姘暹€可掛在墻上。

圖說:微軟的Xbox Kinect以PrimeSense參考設(shè)計(jì)為基礎(chǔ),使用兩個(gè)CMOS成像器(一個(gè)用于紅外光,一個(gè)用于可見光)偵測(cè)3D深度,使系統(tǒng)能夠輕松區(qū)別房間內(nèi)的游戲玩家和背景物體。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。