以下內(nèi)容根據(jù)英偉達全球副總裁兼中國區(qū)總經(jīng)理張建中及青瞳視覺聯(lián)合創(chuàng)始人祖厚超在極客公園 2016 奇點·創(chuàng)新者峰會「What's next about VR 」閉門論壇上的演講整理而成。
英偉達:把下一代 GPU 的性能提升三倍
我覺得很多人都認為是 VR 是很新的技術(shù),大家都認為 2015 年是 VR 的元年。其實我認為 VR 這個技術(shù)大家把它看的太新了,其實 VR 是一個很古老的技術(shù),它從我們很多人沒有出生之前,60 年前,VR 就已經(jīng)開始有人嘗試了。要一個大型的設備把人裝進去,感覺或者模擬,所以說 VR 本身不是一個新科技是一個古老的技術(shù),但是在這個過程當中有許多的科研工作者花很多時間來讓 VR 技術(shù)進步。
事實上,每隔 10 年、20 年,VR 技術(shù)都有不同的變化。在這些變化當中,我們看到大概在 1968 年的時候就有人把 VR 戴在頭上移動了,跟現(xiàn)在我們形式上類似了。
大家認為 2015 年 VR 元年的時候,這個時候才開始有第一代的頭盔,大家體驗的時候覺得一下子很震撼,覺得 VR 科技有很大的飛躍。如果跟歷史比較一下,是什么原因?qū)е?2015 年頭盔能夠給消費者帶來第一次震撼的效果,而不是像 60 年的 VR 只能在實驗室里面讓專家模擬,就是因為我們在 2015 年的時候發(fā)布了新的 GPU。
我們準備在下一代把它整體性能提升三倍。在不停的變化當中,VR 真正能夠進入消費、進入實用階段,GPU 的性能是要有很大很強的計算能力的提升,才能滿足我們用戶的需要。
10 年前我們可能還沒有 GPU,GPU 時間很短,這幾年發(fā)展很塊,帶來是整個計算能力的提升,我們今天最好的 VR 頭盔,你去看的時候,你發(fā)現(xiàn)很多 VR 的體驗都讓人不盡如人意,覺得分辨率不夠高。當我們每個人的手機有了視網(wǎng)膜屏之后,當你看到點再也看不出來之后,那個精度就能滿足我們用戶的需要。今天帶上頭盔你會發(fā)現(xiàn)每張圖片像素是很粗的,直到有一天像素很細之后,你的眼睛不用挑剔圖象質(zhì)量的時候,那時候 VR 的品質(zhì)就會跟今天很不一樣。
在 VR 世界中有很多應用,我們在開發(fā)的時候需要很多的現(xiàn)實模擬,你一定要有很好的方法去模擬真實的世界,要有工具幫助我們開發(fā)者開發(fā)出更好的內(nèi)容。
每個人都知道,人跟機器的交互最簡單的還是靠人自己。你會看到很多用戶體驗方面一定會有很多公司研發(fā)更好更新的科技進行人機交互,我們今天看到很多合作伙伴在不同階段開發(fā)出很多有趣的設備,這些不同的設備在幾個月當中會迭代得非???。我知道有很多公司開發(fā)的人機交互在多人互動的 VR 交互方面已經(jīng)非常成熟了,其中最好的方法還是一個人機友好的交互方式。
沒有好的內(nèi)容技術(shù)的應用是不會成熟的,內(nèi)容驅(qū)動技術(shù)發(fā)展,技術(shù)發(fā)展也帶動了內(nèi)容的進步,在 VR 系統(tǒng)當中內(nèi)容的開發(fā)商才是核心的關(guān)鍵。VR 的引擎和內(nèi)容是非常重要的。
這幾個點結(jié)合起來可以把整個 VR 行業(yè)從傳統(tǒng)帶向新的階段,就可以在整個內(nèi)容方面有一個很大的提升,但是這些提升需要一個強大的 GPU 性能去驅(qū)動。去年的產(chǎn)品已經(jīng)是世界最快的,但是只能達到 60 幀。我們放大成兩個左右眼睛渲染的時候,假設分辨率是 3000×1680,計算能力需要 450MP/S,基本上你要擴大 7 倍的渲染能力,你的 GPU 計算能力要有 7 倍,但是知道這個是非常困難的。
這是我們今年發(fā)布的產(chǎn)品,這也是在所有的網(wǎng)站跟銷售當中賣的最好的顯卡,GTX 1080,只有它才可以滿足 HTC Vive。提升的 7 倍的渲染力,我們在 1080 的顯卡上做到了。在整個 GPU 性能提升之外,我們在里面加了很多 VRWorks 套件的技術(shù)。在這個里面我們把它增加了一個新的渲染引擎,在 GPU 渲染的同時,不只是渲染眼睛看到的部分,它把你的左右方向全部渲染完了,當你的頭左右移動的時候就不需要再做一次工作了。如果 GPU 在渲染一個 360 度鏡像的時候一次性渲染完,你在頭盔移動的時候就不需要再計算了。這種方法可以把整個看到的面或者你的眼睛能看到的視角范圍內(nèi)的畫面全部渲染完。這樣的方式在 GPU 能力不夠的時候,就可以達到很好的性能,你的頭左右移動的時候不需要再渲染一遍。
我們把眼睛看到的畫面折射成你的眼球的曲面,用這樣的方式把 GPU 的圖形圖象渲染能力提升 7 倍,這樣的好處可以讓所有的計算當中減少了很多計算量,你會看到 VR 的性能在 1080 顯卡當中比 GTX960 提升了 7 倍??梢宰?HTC Vive 達到 140 幀。
我們都知道在 VR 的世界當中不只是眼睛去看,所以我們要看到你的視覺、聽覺、觸覺等各個方面模擬出自然世界當中各種各樣的效果。我們利用人的五官,眼睛、耳朵、手、皮膚我們把這些感覺增加進去,專門做了一套 VRWorks 套件,實實在在模擬現(xiàn)實中的一切,物體跟物體之間的碰撞,物體跟物體之間的軌跡,都可以根據(jù)重力加速度模擬。
同時我們也做了非常好的一些開發(fā)工具,這些開發(fā)工具當中包括了很多物理模擬的 SDK,其中有 PHYSX,拆分成小顆粒做很多分子運動的模擬,也可以做很多流體的模擬,可以做很多細搭的建筑物,精細到每個細小的小塊,讓它產(chǎn)生實際的效果??梢钥吹胶芏鄳?zhàn)爭的場面,破碎的物體。
怎么樣體現(xiàn)這個,我們?yōu)榱俗尯芏嚅_發(fā)者學會使用這些新的 SDK,我們做了一款游戲叫FUNHOUSE,建議每個人欣賞體驗一下 FUNHOUSE 帶來的效果,我們打算把源代碼開放在網(wǎng)上,讓所有的開發(fā)者自己下載。我們也打算跟國內(nèi)的游戲開發(fā)社區(qū),給大家提供相應的技術(shù)支持,教會每一個開發(fā)者有能力開發(fā)出更加逼真的自然的游戲效果。
這個效果到底怎么樣,我建議每個人找到設備去體驗,這個模型做的很簡單,簡單的物理特效模擬游樂場,所有的運動軌跡是一樣的,如果籃球可以產(chǎn)生重力加速度,反彈和碰撞產(chǎn)生的結(jié)果都是非常真實,氣球破碎之后粒子的狀況,如果游戲開發(fā)的好,可以開發(fā)的很細,如果開發(fā)的很細對于我們的 GPU 就會很麻煩,你會很快秒殺我們的 1080,有的人可能會買 4 塊,也是促進我們盡快研發(fā)下一代 GPU。其實很多人玩家覺得這個顯卡太慢,這也是 GPU 為什么這幾年加速發(fā)展的過程。
為了讓這些東西做的很好,AUDIO 是非常重要的一點,為了把這個做好,這個也是非常簡單就是聲音的折射和反射,對于 GPU 來說非常容易,因為在 GPU 有一個引擎專門做光線追蹤,如果有到聲音里面更加容易,聲音源沒有那么,反而光源會很多,我們把這個算法加進 VRWorks 套件里面。當然我們每個人都會迫切需要 Volta 盡快上市,好消息是它會很快,壞消息是還要等兩年。
今年如果我們是投資人你會發(fā)現(xiàn)投資的兩大科技點一個就是 AI,一個就是 VR,所有這一切就是基于 GPU,如果一個企業(yè)不懂 GPU 研發(fā),你投資給它是有點浪費的,因為它很難找到技術(shù)源泉驅(qū)動他的應用。
總結(jié)一下 VR 里面,我相信 VR 當中對于我們整個生態(tài)系統(tǒng)來講,無論是做 HMD、引擎還是游戲公園,大家如果有什么技術(shù)幫助可以找我們 NVIDIA,我們也愿意跟所有的同行,所有的生態(tài)系統(tǒng)的合作伙伴共同把 VR 推向一個新的高度,這個點是非常好的點,全球的投資和全球的開發(fā)點,起步點是一樣的,沒有先后,中國絕對有機會超過全球其它國家,我們也希望中國的開發(fā)者能成為全球最的開發(fā)者,謝謝大家!
青瞳視覺:深挖單一技術(shù)才能成功
現(xiàn)在交互對虛擬現(xiàn)實來說越來越重要,在 2014 年頭盔越來越廉價,很多人用得起,效果越來越好,2014、2015 年大家關(guān)注點可能在頭盔領域。我們在做青瞳之前不是結(jié)合頭盔在用,它的領域非常多,我們更多的結(jié)合的是投影機、機器人領域做一些嘗試,但是每個嘗試沒有得到很好的市場反饋。
后面我們探索了很長時間,就選了虛擬現(xiàn)實主題公園這個方向,在 2015 年的時候,很多人介入到虛擬現(xiàn)實領域都是為了掘金,中間有一個很有趣的故事,當時廚師協(xié)會的會長跑進來做 VR 做了一段時間跟他想的不一樣,他堅持了半年投入了 60 多萬,結(jié)果跟自己想的不一樣,發(fā)現(xiàn)坑太深。
追蹤系統(tǒng)本身作為交互技術(shù),可以跟 VR、AR、無人機結(jié)合都可以。所以現(xiàn)在追蹤在這塊,遠比我們想像的多,而且交互在后面的發(fā)展包括像現(xiàn)在主題公園,我們現(xiàn)在接觸了非常多的做主題樂園,包括做交互的,大家對交互意識重要性越來越大,他會測試幀速夠不夠,精度夠不夠。
我先說一下目前的當時在確定下來做追蹤市場的話,當時研究了幾項,包括在 Xbox、PS 等方面。在 PS 追蹤系統(tǒng)跟游戲結(jié)合互動,大家覺得坐在那兒玩不夠爽,青瞳的定位就是做大產(chǎn)品的追蹤,不做小的。我可能做一個桌面級的,PS 馬上能把我取代掉。我們后來定位就是參考了國外的模式,做 VR 的主題樂園。
這個是我們當時在分析的時候看每個板塊,這個也是國外的一些信息,大家可以看到每一個領域都需要追蹤。我最早做虛擬現(xiàn)實的教育領域,大家需要追蹤,或者模擬訓練,后面大家意識到模擬越來越重要。
這是當時做的幾個對比,因為一直在做這一塊,所以很多時候會被別人問到你們的差異在那兒,比如說 Kinect 是微軟的配件,價值非常便宜,用途也是最廣的,但是 Kinect 很難結(jié)合 VR 的做一些優(yōu)秀的內(nèi)容出來。Kinect 只有 30 幀的幀速,所以畫面有明顯的延遲。如果結(jié)合 VR 做一些深度的互動,我在里面可能還有道具和產(chǎn)品結(jié)合,Kinect 沒有辦法支撐。
比如做 VR 體驗的時候,規(guī)定只是人進去或者只是頭盔進去,我希望周邊的道具進去,把紅外點粘到槍上,槍可以是木頭槍,在虛擬現(xiàn)實里面可以辦成很酷的槍,沉浸感會把你帶進去。
還有一個激光發(fā)射基站是 HTC 現(xiàn)在在做的,用的最廣的。SLAM,現(xiàn)在非常紅,大家都在追著去用,因為現(xiàn)在大部分的追蹤方案對于空間產(chǎn)品的限制比較大,大家希望我的攝像機在頭盔上可以擺脫所有的束縛,用 SLAM 方式去做。但是它的數(shù)據(jù)非常大,包括延遲,離真正的商用還是有一段距離。
激光雷達我在所有的國內(nèi)的線下的 VR 體驗基本上沒有見到過,激光雷達成本高。比如我在紅外的點上,貼到這個點可以定一個序號,比如這個序號是 1,但是激光雷達做不到,第二個也會有一些干擾因素。
這個是我們現(xiàn)在給自己的定位:賣最好的追蹤產(chǎn)品。第一個本身團隊的性質(zhì)決定的,我們整個團隊 90% 偏研發(fā),而且又是專門專攻追蹤這塊,基于這樣的情況我們專門做追蹤產(chǎn)品。我們自己的盈利模式、變現(xiàn)渠道都比較清晰。
這個是我們在做 VR 的主題公園整個的架構(gòu),在整個虛擬現(xiàn)實體驗,這里面最大的一塊在追蹤系統(tǒng),現(xiàn)在很多虛擬現(xiàn)實的體驗,比如說我在上海某一個商場做一下,但是效率非常低,一個小時只能體驗一兩個人,這塊我們現(xiàn)在更多的是傾向和別人合作。我們跟米粒合作,它電影宣發(fā)要找亮點,而且它有自己的 IP 和內(nèi)容。
最上面的部分是 Cameras,我們對于可見光、對紅外有一定的過濾。一般對于這樣的場地,對于光線有一定的要求,比如說 Cameras 上面有強電從旁邊經(jīng)過,這種 Cameras 追蹤系統(tǒng)都不會特別穩(wěn)定,細節(jié)的東西我們實踐的時候,發(fā)現(xiàn)很多東西遠比自己想的多。
這是應用結(jié)合比較緊的方向,第一個是線下體驗,我們現(xiàn)在做的 VR 主題樂園方面,線下體驗這種方式北京、上海和廣州都有一些示范的點出來,都能看到,而且基本上三個月迭代一次。
教育這塊,更多的是作為培訓,對互動的要求比較高,希望通過這種方式培養(yǎng)學生,通過虛擬的環(huán)境進行一些操作,可以得到一些學習的經(jīng)驗。
軍事這塊,需求比較大,但是門檻比較高,軍工部分有保密機制,所以做市場化的公司沒有技術(shù),沒有這個資質(zhì)是不能直接做的,而且周期是比較長的,不一定適合我們現(xiàn)在做。
影視動畫,在影視動畫里面,我們跟影視基地合作,我們解決的是技術(shù)端的事情,具體的應用的東西他們通過他們實踐的方式反饋回來,通過他們的反饋再去迭代。