如何通過(guò)SLAM技術(shù)應(yīng)用改變?cè)鰪?qiáng)現(xiàn)實(shí)
增強(qiáng)現(xiàn)實(shí)已經(jīng)成為比VR技術(shù)還要熱門(mén)的技術(shù),屬于它的繁榮還在后頭。近日我們來(lái)介紹一下,如何利用SLAM技術(shù)的應(yīng)用進(jìn)而改變?cè)鰪?qiáng)現(xiàn)實(shí)技術(shù)的。
當(dāng)這兩種不同的交互方式開(kāi)始無(wú)縫融合的時(shí)候,我相信我們會(huì)看到最強(qiáng)大和最廣泛采用的增強(qiáng)現(xiàn)實(shí)實(shí)現(xiàn)。
盡管普及率有限,但增強(qiáng)現(xiàn)實(shí)顯然是當(dāng)前最熱門(mén)的技術(shù)領(lǐng)域之一。這在很大程度上是因?yàn)橥ㄟ^(guò)標(biāo)記追蹤來(lái)實(shí)現(xiàn)AR傳統(tǒng)方式,以及隨之而來(lái)的高門(mén)檻障礙。
1. 圖像識(shí)別與標(biāo)記追蹤
除了3D模型和動(dòng)畫(huà)之外,增強(qiáng)現(xiàn)實(shí)的支點(diǎn)是建立在兩個(gè)緊密相關(guān)的技術(shù)上:圖像識(shí)別與標(biāo)記追蹤。當(dāng)兩者配對(duì)在一起時(shí),它們可以支持?jǐn)z像頭識(shí)別圖像的數(shù)據(jù),從而觸發(fā)相關(guān)的體驗(yàn)并在三維空間中追蹤相對(duì)于攝像頭的眼睛位置。通過(guò)將圖像上傳至處理服務(wù)器,開(kāi)發(fā)者可以將一個(gè)或多個(gè)圖像關(guān)聯(lián)到單個(gè)增強(qiáng)現(xiàn)實(shí)體驗(yàn)。這樣,設(shè)備上的攝像頭就能夠理解并追蹤疊加的數(shù)字內(nèi)容。
對(duì)于其工作原理,我們首先要理解兩個(gè)核心概念。首先是Marker DetecTIon(標(biāo)記檢測(cè)),即通過(guò)相機(jī)鏡頭識(shí)別圖像(通常稱(chēng)為標(biāo)記),并且與服務(wù)器上的對(duì)應(yīng)部分建立關(guān)聯(lián)以觸發(fā)體驗(yàn);其次是Marker Tracking(標(biāo)記追蹤),或者說(shuō)能夠維持物理對(duì)象或標(biāo)記的實(shí)時(shí)方向,并且不斷更新數(shù)字內(nèi)容以模擬它的能力。
一個(gè)基于標(biāo)記的AR體驗(yàn)的例子
檢測(cè)和追蹤的質(zhì)量由一系列的參數(shù)決定,主要是對(duì)比點(diǎn)的復(fù)雜度和標(biāo)記所缺乏的重復(fù)模式。對(duì)于優(yōu)秀標(biāo)記和糟糕點(diǎn)擊的各種復(fù)雜難點(diǎn),我可以另起一篇文章進(jìn)行闡釋。雖然這仍然為用戶提供了強(qiáng)大的體驗(yàn),但它具有明顯的局限性,而自其誕生依賴便一直在困擾著整個(gè)行業(yè)。從用戶體驗(yàn)的角度來(lái)看,我不僅需要下載特定的應(yīng)用程序,同時(shí)還需要對(duì)應(yīng)的物理對(duì)象才能激活體驗(yàn)。但借助SLAM,用戶只需一臺(tái)移動(dòng)設(shè)備即可訪問(wèn)內(nèi)容。
2. 即時(shí)定位與地圖構(gòu)建(SLAM)即時(shí)定位與地圖構(gòu)建的英文簡(jiǎn)稱(chēng)是SLAM。這種技術(shù)直到最近才成為了一個(gè)可行的選擇,因?yàn)樵絹?lái)越多的設(shè)備開(kāi)始搭載輔助性的深度攝像頭(在撰寫(xiě)這篇文章的時(shí)候,谷歌和蘋(píng)果已經(jīng)找到了繞開(kāi)專(zhuān)用輔助攝像頭的方法) ,而這是支持SLAM的必要條件。
這項(xiàng)技術(shù)基本上可以主動(dòng)識(shí)別空間中的墻壁,地板和其他物理障礙。目前,大多數(shù)利用SLAM的應(yīng)用程序只是采用樓層識(shí)別和位置追蹤來(lái)把AR對(duì)象放置在用戶周?chē)谋砻嫔?。少?shù)幾個(gè)平臺(tái)能夠處理額外的空間信息(如墻壁,天花板和家具等等),從而可以更深入地理解周?chē)沫h(huán)境。目前大量利用這些功能的兩大平臺(tái)是蘋(píng)果ARKit和谷歌ARCore。
3. 密集式點(diǎn)云重建:3D世界的點(diǎn)描技法這為開(kāi)發(fā)者創(chuàng)建原來(lái)不可能實(shí)現(xiàn)的AR體驗(yàn)提供了多樣性和靈活性。SLAM能夠主動(dòng)對(duì)它認(rèn)為存在的表面進(jìn)行每秒數(shù)百次的粗略估計(jì),并用描點(diǎn)或頂點(diǎn)固定這些微觀位置。通過(guò)建立一個(gè)密集式點(diǎn)云重建,設(shè)備攝像頭不僅可以識(shí)別物理空間,而且還可以記住物體轉(zhuǎn)向時(shí)的相對(duì)位置。下面是該技術(shù)實(shí)時(shí)處理信息時(shí)的演示:
基于追蹤的體驗(yàn)?zāi)軌蛱峁┮粋€(gè)巨大的優(yōu)勢(shì):情景。當(dāng)用戶拾起一個(gè)物體時(shí),激活的數(shù)字內(nèi)容感覺(jué)就像是物體的一部分。假如我從全麥蜂蜜堅(jiān)果麥圈中激活了一個(gè)AR體驗(yàn),然后其中的卡通吉祥物從包裝盒中飛走,這將成為一種有意義的執(zhí)行。這種行為使得應(yīng)用程序能夠真正成為物理世界的“瀏覽器”。用SLAM來(lái)實(shí)現(xiàn)這一點(diǎn)要困難得多,因?yàn)楸M管電腦可以更好地理解世界的形式,但無(wú)法根據(jù)它所看到的內(nèi)容來(lái)提供實(shí)質(zhì)性的反饋。
通過(guò)SLAM,用戶可以逼真地在辦公室里控制卡通水管工人(如馬里奧)收集金幣或者躲開(kāi)危險(xiǎn)的食肉植物;用實(shí)際上并不存在的家具和海報(bào)來(lái)重新裝修臥室;或者在街道上放置一系列箭頭,然后用GPS定位到最接近的咖啡店。當(dāng)這兩種不同的交互方式開(kāi)始無(wú)縫融合的時(shí)候,我相信我們會(huì)看到最強(qiáng)大和最廣泛采用的增強(qiáng)現(xiàn)實(shí)實(shí)現(xiàn)。這種融合技術(shù)的潛能無(wú)窮無(wú)盡。
SLAM技術(shù)的應(yīng)用不僅只局限于增強(qiáng)現(xiàn)實(shí)。整體而言,SLAM可以幫助為計(jì)算機(jī)提供更符合字面意義的“眼睛”,使得它們能夠通過(guò)視覺(jué)輸入來(lái)理解周?chē)囊磺小_@種理解已經(jīng)擴(kuò)展到機(jī)器人,自動(dòng)駕駛汽車(chē),機(jī)器學(xué)習(xí)和人工智能等領(lǐng)域。





