日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 先來簡單梳理下AR的核心技術(shù) AR(Augmented Reality),是在現(xiàn)實世界中疊加虛擬信息,也即給現(xiàn)實做“增強”,這種增強可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓

先來簡單梳理下AR的核心技術(shù)

AR(Augmented Reality),是在現(xiàn)實世界中疊加虛擬信息,也即給現(xiàn)實做“增強”,這種增強可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現(xiàn)實的世界和虛擬的世界融合在一起。

其中,對現(xiàn)實世界的認知主要體現(xiàn)在視覺上,這需要通過攝像機來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實現(xiàn)對三維世界環(huán)境的感知理解,比如場景的3D結(jié)構(gòu),里面有什么物體,在空間中的什么地方。而3D交互理解的目的是告知系統(tǒng)要“增強”的內(nèi)容。

圖。典型AR流程

這其中有幾個關鍵點:

首先是3D環(huán)境理解。要理解看到的東西,主要依靠物體/場景的識別和定位技術(shù)。識別主要是用來觸發(fā)AR響應,而定位則是知道在什么地方疊加AR內(nèi)容。定位根據(jù)精度的不同也可以分為粗定位和細定位,粗定位就是給出一個大致的方位,比如區(qū)域和趨勢。而細定位可能需要精確到點,比如3D坐標系下的XYZ坐標、物體的角度。根據(jù)應用環(huán)境的不同,兩種維度的定位在AR中都有應用需求。在AR領域,常見的檢測和識別任務有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。

在感知現(xiàn)實3D世界并和虛擬內(nèi)容融合后,需要以一定方式將這種虛實融合信息呈現(xiàn)出來,這里面需要的就是AR中的第二個關鍵技術(shù):顯示技術(shù), 目前大多數(shù)的AR系統(tǒng)采用透視式頭盔顯示器,這其中又分為視頻透視和光學透視,其他的代表有光場技術(shù)(主要因Magic Leap而顯名)、全息投影(在科幻影視劇作品中常出現(xiàn))等。

AR中的第三個關鍵技術(shù)在于人機交互,用以讓人和疊加后的虛擬信息互動,AR追求在觸摸按鍵之外自然的人機交互方式,比如語音、手勢、姿態(tài)、人臉等,用的比較多的語音跟手勢。

人工智能和AR的技術(shù)關聯(lián)

在人工智能領域有幾個概念常被提及,如深度學習(DL)、機器學習(ML),在學術(shù)領域包括人工智能(AI)在內(nèi)幾大領域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智能,涵括所有“讓機器像人一樣”的技術(shù)的應用方向。

從這張圖也可以簡單一窺三者的關系,深度學習是實現(xiàn)機器學習的一種技術(shù)方式,而機器學習是為了讓機器變得智能,去達到人工智能??梢哉f人工智能是最終目標,而機器學習是為了實現(xiàn)這個目標延伸出的一個技術(shù)方向。在這其中,還有另一個重要概念為計算機視覺(CV),主要來研究如何讓機器像人去“看”,是目前人工智能概念中的一個重要分支,這也是因為人類獲取信息最主要的方式之一就是視覺,目前計算機視覺已經(jīng)在商業(yè)市場發(fā)揮價值,比如人臉識別;自動駕駛中讀取交通信號和注意行人以導航;工業(yè)機器人用來檢測問題控制過程;三維環(huán)境的重建圖像的處理等等。這些概念既有區(qū)分也有一定范圍的重疊。

其中,2006年開始,Hinton引發(fā)的深度學習熱潮開始蔓延,在一定程度上帶動了AI的又一次崛起,十年中,在包括語音識別、計算機視覺、自然語言處理在內(nèi)的多個領域取得重大突破,并向應用領域延伸,正發(fā)展的如火如荼。

在AR的核心技術(shù)中,3D環(huán)境理解、3D交互理解和計算機視覺、深度學習都有著緊密的聯(lián)系。3D環(huán)境理解在學術(shù)界里主要對應的是計算機視覺領域,而近年來深度學習在計算機視覺中得到廣泛應用。交互方面,更趨自然的交互方式如手勢和語音在硬件終端的使用,得益于近幾年深度學習在相關領域的突破。也可以說,深度學習在AR中應用主要在視覺關鍵技術(shù)。

目前,AR最常見的形式的2D圖片掃描識別,如騰訊QQ-AR火炬活動、支付寶五福等多數(shù)AR營銷中所見,用手機掃描識別圖出現(xiàn)疊加的內(nèi)容,但主要的研發(fā)方向還在3D物體識別和3D場景建模。

現(xiàn)實的物體是以3D形態(tài)存在的,有不同的角度和空間方位。所以一個自然的擴展就是從2D圖片識別到3D物體識別,識別物體的類別和姿態(tài),深度學習可以用在這里。以水果識別為例,識別不同類別的水果,并且給出定位區(qū)域,即集成了物體識別與檢測的功能。

3D場景建模,從識別3D物體擴大到更大更復雜的3D區(qū)域。比如識別場景里面有哪些東西、它們的空間位置和相互關系等等,這就是3D場景建模,是AR比較核心的技術(shù)。這其中涉及目前熱門的SLAM(實時定位與地圖構(gòu)建)。通過掃描某個場景,然后在上面疊加虛擬戰(zhàn)場等三維虛擬內(nèi)容。如果只是基于普通2D圖像識別就需要有特定的圖片,而在圖片不可見時會識別失敗。而在SLAM技術(shù)里面,即使特定平面不存在,但是空間定位依然非常精確,就是因為有周圍3D環(huán)境的幫助。

這里想探討下深度學習和SLAM技術(shù)的融合,計算機視覺大體上可以分兩個流派,一種基于學習的思路,例如特征提取-特征分析-分類,目前深度學習技術(shù)在這一路線上取得了主導性的地位。另外一種路線是基于幾何的視覺,從線條、邊緣、3D形狀推出物體的空間結(jié)構(gòu)信息,代表性的技術(shù)就是SFM/SLAM?;趯W習的方向上深度學習基本上一統(tǒng)天下,但是在基于幾何視覺的領域,目前相關的進展還很少。從學術(shù)界而言,深度學習技術(shù)的研究進展可以說日新月異,而SLAM技術(shù)最新十年的進展相對較少。在國際視覺頂級會議ICCV 2015年度組織的SLAM技術(shù)專題討論會上,基于近年深度學習在視覺其它領域的快速發(fā)展,有與會專家曾提出SLAM中采用深度學習的可能性,但是目前還沒有成熟的思路??傮w而言,短期內(nèi)將深度學習和SLAM融合是一個值得研究的方向,長遠來看聯(lián)合語義和幾何信息是一個非常有價值的趨勢。因此,SLAM+DL值得期待。

在交互方式,主要的包括語音識別和手勢識別,語音識別在目前已經(jīng)取得了較大進展,國內(nèi)如百度、科大訊飛、云知聲等都是其中的佼佼者,AR公司更想突破的是手勢識別的成熟商業(yè)化,比如亮風臺展示過的一款基于深度學習的手勢識別系統(tǒng),主要定義了上下左右、順時針、逆時針六種手勢,首先實現(xiàn)人手的檢測和定位,然后通過識別相應的手勢軌跡來實現(xiàn)對人手勢的識別。而人臉識別等其他人工智能熱門領域在AR中也有使用,但不是AR公司重要的研發(fā)方向。

以上不難看出,AR的底層技術(shù)或者說基礎部分是計算機視覺以及關聯(lián)領域的融合,而當下熱門的深度學習和AR的結(jié)合,也是算法工程師們的努力方向。這也是AR為計算機視覺與人機交互的交叉學科,AR的基礎是人工智能和計算機視覺等說法的依據(jù)。

圖:計算機視覺與AR流程關聯(lián)

在去年今日頭條發(fā)布的《人工智能影響力報告》中也簡單統(tǒng)計了人工智能科學家的分布情況,這其中包括人臉識別、語音識別、機器人、AR、芯片等領域的公司與大型研發(fā)機構(gòu),高端研發(fā)人員的分布也說明了AI領域的細分方向。

那AR究竟是不是人工智能?

對AR從業(yè)者來說,理想的狀態(tài)是用更智能的AR終端去取代智能手機,所以對于用戶來說接觸使用AR首先受影響的是內(nèi)容,其次是終端,AR產(chǎn)業(yè)鏈如果粗暴劃分包括技術(shù)提供商、智能終端研發(fā)公司,以及AR內(nèi)容提供商。在這其中,AR設備提供商不可避免關注硬件技術(shù),如底層的芯片、電池、光學鏡片等,以及硬件本身的性能優(yōu)化,而內(nèi)容提供商更傾向于在現(xiàn)有技術(shù)基礎上優(yōu)化內(nèi)容及表現(xiàn)。所以我們可以說AR技術(shù)提供商,或者說在底層算法研發(fā)上有一定成績的AR公司是人工智能公司。

對公司來說,特別是創(chuàng)企會把底層技術(shù)轉(zhuǎn)化為成熟的產(chǎn)品或服務,這可能是如無人機、AR智能終端、機器人等,也可能是行業(yè)解決方案,以達到商業(yè)目的,并且這已經(jīng)成為在沸騰聲音之后,媒體、企業(yè)以及大眾對AI企業(yè)的期待和要求。近期,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)出版的圖書《人工智能浪潮:科技改變生活的100個前沿AI應用》將對外發(fā)布,以及涵括了目前巨頭公司以及創(chuàng)企在商業(yè)化上的前沿成果,也直接反映了AI目前的主要商業(yè)化方向。

作為技術(shù)驅(qū)動的商業(yè)領域,無論是AR還是人工智能的其他多數(shù)方向,技術(shù)距離完全成熟還有很長的路程要走,在整個產(chǎn)業(yè)鏈逐漸繁榮,關注商業(yè)化實現(xiàn)的同時,也需要有更多公司機構(gòu)去不斷拓展技術(shù)邊界,建立核心競爭力,讓行業(yè)爆發(fā)更大的價值與潛力,如此,AI時代中國彎道超車當可期。

來源:中國人工智能網(wǎng)

本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關鍵。

關鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關鍵字: LED 驅(qū)動電源 開關電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅(qū)動電源
關閉