掃描二維碼
隨時隨地手機看文章
編譯 | 禾木木出品 | AI科技大本營(ID:rgznai100)看到下面這個老黃是不是覺得很Q~
11月9日,GTC 大會再次來了,英偉達創(chuàng)始人兼CEO黃仁勛再次從自己虛擬廚房走出來。本次 GTC 大會都有哪些亮點呢?
英偉達展示過如何使用 Omniverse 來模擬倉庫、工廠、物理與生物系統(tǒng)、5G 通信、機器人、自動駕駛汽車,現(xiàn)在最新的技術可以直接生成全功能的虛擬形象了。這個 Q 版老黃叫 Toy-Me,可以和人進行自然語言交流。它使用了目前規(guī)模最大的預訓練自然語言處理模型 Megatron 530B,通過自己的聲音、形象和講話姿勢,整個人也帶光追特效。one more thing !這一切都是實時生成的。黃仁勛表示,“你會看到這個虛擬形象是基于目前訓練的最大語言模型的語言處理打造,包括聲音也是用我自己的語音進行合成,還可以看到實時基于光線追蹤的精美圖像?!?/span>黃仁勛演示3個人分別讓虛擬形象回答關于氣候變化、天文學以及生物蛋白質(zhì)等問題,都可以對答如流。可謂是上知天文,下知地理!
Omniverse Avatar 是一款基于語言、計算機視覺、自然語言理解、推薦引擎和模擬技術生成的交互式 AI 化身。它具有光線追蹤 3D 圖形的交互式角色,可以看到、說話、就廣泛的主題進行交談,并理解對話的意圖。
Omniverse Avatar 為創(chuàng)建人工智能助手打開了大門,這些助手幾乎可以為任何行業(yè)輕松定制。這些可以幫助處理數(shù)十億的日??蛻舴栈?,像是餐廳訂單、銀行交易、個人約會和預訂等等,從而帶來更多商機并提高客戶滿意度。
這個小機器人可以通過語音識別、眼神追蹤來推斷顧客的意圖,并能在2秒左右作出反應,回答顧客提出的問題或要求。“智能虛擬助手的曙光已經(jīng)到來,”英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。“Omniverse Avatar 結合了英偉達的基礎圖形、模擬和 AI 技術,創(chuàng)造了一些有史以來最復雜的實時應用程序。協(xié)作機器人和虛擬助手的用例令人難以置信且影響深遠?!?/span>
Avatar 的自然語言理解是基于 Megatron 530B 大型語言模型,能夠識別、理解和生成人類語言。Megatron 530B 是一個預訓練模型,它可以在很少或根本沒有訓練的情況下完成句子,例如:回答大量主題領域的問題,完形填空、閱讀理解、常識推理,自然語言推理、翻譯成其他語言等,除了這些訓練完,還可以處理許多未經(jīng)專門訓練的領域。Avatar 的推薦引擎由 NVIDIA Merlin 提供,該框架允許企業(yè)構建能夠處理大量數(shù)據(jù)的深度學習推薦系統(tǒng),以提出更明智建議。 Avatar 的感知能力由NVIDIA Metropolis啟用,這是一種用于視頻分析的計算機視覺框架。頭像動畫由 NVIDIA Video2Face 和Audio2Face、2D 和 3D 人工智能驅(qū)動的面部動畫和渲染技術提供支持。Omniverse Avatar 將這些技術被組合成一個應用程序,并使用 NVIDIA 統(tǒng)一計算框架進行實時處理。在 Keynote 中,英偉達還展示了 Omniverse 的一系列新功能,包括 Showroom,負責展示圖形、物理、材質(zhì)和 AI。Farm一個系統(tǒng)層,用于協(xié)調(diào)跨多系統(tǒng),工作站、服務器、裸機或虛擬化的批處理作業(yè)。Omniverse AR 可以將圖形串流到手機和 AR 眼鏡上。Omniverse VR 是首款全幀率交互式光線追蹤 VR。