從宣傳視頻分析HoloLens技術(shù)
來源:數(shù)字音視工程網(wǎng) 作者:徐浩 編輯:航行150 2015-01-23 15:30:16 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機(jī): | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗證碼: |
|
Hololens所實現(xiàn)的效果并不是微軟一家的創(chuàng)新,他早已流傳在種種科幻電影中。但能做到hololens所需要的程度是一個極其復(fù)雜的工程。HoloLens是一個Oculus+Kinect+Jetson TK1所集成起來的夾在鼻梁上的嵌入式怪物。
腦補(bǔ)一下把Kinect帶到頭上的情景
但是微軟做到了!
首先給沒有看宣傳視頻的孩子介紹下HoloLens吧,HoloLens是一個基于深度攝像頭,高性能處理器和雙屏幕顯示的進(jìn)階版Glass。
長這個樣子
具體參見微軟官網(wǎng)Microsoft HoloLens
根據(jù)我目前看到的信息,HoloLens 需要的技術(shù)支持包括三個部分:
實時的三維計算
這是游戲?qū)猛鏍€的東西,可以說在阿凡達(dá)之后拉開了一個時代的幕布,經(jīng)過 NVIDIA、Intel 等公司的苦心經(jīng)營,實時的雙攝像頭渲染已經(jīng)很成熟。微軟終于把這種技術(shù)推向了更廣的領(lǐng)域。下圖這種效果在也就是現(xiàn)在是游戲級別的水平。
精準(zhǔn)的姿態(tài)確定和位置確定
根據(jù)網(wǎng)上流傳的信息,可以肯定微軟采用了基于深度識別的 SLAM(實時定位與地圖構(gòu)建)技術(shù)。這里解釋一下什么是 SLAM,就是通過傳感器獲取環(huán)境的有限信息,比如視覺信息、深度信息、自身的加速度和角速度等來確定自己的相對或者絕對位置,并完成對于地圖的構(gòu)建。
SLAM 的準(zhǔn)確度對于最后的顯示效果非常重要,姿態(tài)確定就不是事兒。幾十塊的電容式陀螺儀或者幾百塊的 MEMS 抄幾段代碼就好,但怎么確定位置就是微軟的功力了。當(dāng)然深度攝像頭這種事情微軟常年吊打整個行業(yè),Kinect 快成行業(yè)標(biāo)準(zhǔn)了(幫助了多少論文發(fā)表)。想想我們用的激光雷達(dá)的價格。真是要哭了。
電影中,使用小型探測器掃描出來了隧道全景并且全息呈現(xiàn)了出來。對應(yīng)到現(xiàn)實《普羅米修斯》里面用的是這種玩意,相當(dāng)于一輛低配的奧迪 A8 的價格,可以發(fā)射幾十束激光同時掃描。Google 無人車也用這種激光雷達(dá)來進(jìn)行實時的路況分析。
微軟做到的可是實現(xiàn)了三年前科幻電影的效果啊!
注意這張圖,微軟暗示進(jìn)入一個房間之前要先進(jìn)行掃描,這里明顯是在用 Deep Camera 生成 Point Cloud 然后三角面片進(jìn)行 SLAM(我實驗室的某個師兄在微軟實習(xí)的時候,做的畢業(yè)設(shè)計也是這個,微軟在這個技術(shù)上的積累很強(qiáng)的)。如果確定是和 Kinect 類似的紅外攝像頭,那么可以認(rèn)為 kinect 有的毛病他都會有,比如對黑色物體、光滑表面的探測。
可以說,HoloLens 的核心難度是深度探測和相關(guān)的手勢識別。這可是微軟的專長了。所以 HoloLens 就是一個戴到了鼻梁上的 Kinect。
為什么說 SLAM 對于 HoloLens 非常重要呢?因為只有實現(xiàn)了靠譜的 SLAM,才能知道眼鏡的空間坐標(biāo)和相對于室內(nèi)各種障礙物的位置,同時識別出各種室內(nèi)擺件的形狀,這是宣傳片中人機(jī)交互的基礎(chǔ)。
在視頻中,主人公一直在走動,畫面的穩(wěn)定性很好。
注意上圖這里,可以看到對于各個表面的貼合度已經(jīng)達(dá)到了 SLAM 的程度。
圖像識別技術(shù)
這里注意到一個細(xì)節(jié),展示在三維空間中的 UI 很像是 Autodesk Fusion 的 UI,難道自動桌已經(jīng)先行一步?來自官網(wǎng)的一張圖片,可以看到使用的正是 Autodesk。
作為半個工程師,我當(dāng)時買 Leap Motion 就是為了玩 Solidworks Fusion。現(xiàn)在有了 HoloLens,比 Fusion 體驗不知道酸爽多少倍。腦補(bǔ)一下去參觀 EAST 的時候眼睛里顯示出 EAST 剖面的情景。不能再震撼了。
這三個技術(shù)在近些年成熟,促成了 HoloLens 產(chǎn)品化。之前 Google Glass 的設(shè)想與此類似,Hololens 把它推向了現(xiàn)實。
其實 Hololens 所實現(xiàn)的效果也不是新鮮貨。早在冷戰(zhàn)末期,武裝直升機(jī)飛行員就通過頭盔里面的信息來操作機(jī)槍所瞄準(zhǔn)的方向。這兩年我軍也有裝備。當(dāng)年 Su35 的“回馬槍”向后發(fā)射的導(dǎo)彈就是用尾椎雷達(dá)和頭盔瞄準(zhǔn)具實現(xiàn)的。
更進(jìn)一步,上圖用到的也是類似的技術(shù)。
不過,根據(jù)技術(shù)分析,Hololens 可能會遇到如下一系列困難:
第一,耗電量。計算視覺、SLAM,以及反過向進(jìn)行三維虛擬現(xiàn)實,都是常耗費計算量的任務(wù)。Hololens 是時勢造英雄的產(chǎn)品,這種計算量在二十年前可是阿拉莫斯實驗室用于核聚變模擬的計算量。現(xiàn)在只要耗電量跟的上,NVIDIA 的 Tegra K1 還有 Intel 家的協(xié)處理器在嵌入式上飆計算量沒問題。
第二,是在開放環(huán)境、欠光線環(huán)境的識別度問題。我對此持保守態(tài)度,得拿到產(chǎn)品再說。
第三,是定位精準(zhǔn)度問題。這是老大難問題了。
事實上,上圖中這種配合將成為很長一段時間內(nèi)的主流。
如果修的不是自來水管而是血管,看到的是通過 B 超技術(shù)實時掃描出來的人體內(nèi)部,那么未來的醫(yī)院會是怎么樣的。如果顯示的不是自來水管的 manual,而是實時匹配無人機(jī)的爆炸視圖,那么以后的工廠和 DIY 是怎么樣的。
讓人難以想象的是,這一切居然要成真了!
估計 Google 也會坐不住了,也會有大動作,相關(guān)技術(shù)大部分(包括廉價的深度攝像頭)都是開源的,估計很快會有公司扛包出現(xiàn)類似設(shè)備的開源硬件和軟件,市場一刺激華強(qiáng)北也不會安分,投資空間有多大。各位手里有錢的主,都掂量掂量吧。由 iPhone 引發(fā)的歷史軌跡就是證明。
看起來,全息估計不會成為主流發(fā)展方向了。
本文來源:雷科技 作者:徐浩
評論comment