3DGS(3D Gaussian Splatting,三維高斯濺射)是2023年SIGGRAPH會議提出的革命性三維場景表示與實時渲染技術(shù),其核心創(chuàng)新在于以可學習、可參數(shù)化的3D高斯分布作為場景的基本表征單元,通過可微分渲染與并行光柵化技術(shù),在保持高保真重建質(zhì)量的同時,實現(xiàn)了傳統(tǒng)三維重建技術(shù)難以企及的實時渲染性能,徹底打破了“重建精度”與“渲染效率”的固有矛盾,成為連接物理世界與數(shù)字空間的關(guān)鍵技術(shù)橋梁。作為神經(jīng)渲染與計算機圖形學融合的典型成果,3DGS不僅重構(gòu)了三維場景建模與渲染的技術(shù)范式,更在數(shù)字孿生、自動駕駛仿真、AR/VR、文化遺產(chǎn)數(shù)字化等領(lǐng)域展現(xiàn)出巨大應用潛力,其技術(shù)原理、核心優(yōu)勢、實現(xiàn)流程與行業(yè)價值共同構(gòu)成了完整的技術(shù)體系。3DGS的核心思想是將復雜的三維場景解構(gòu)為數(shù)百萬個具備獨立屬性的3D高斯“基元”,每個高斯基元本質(zhì)上是一個三維橢球體,通過一組可學習的參數(shù)精準定義其在空間中的狀態(tài),包括位置(高斯分布的中心坐標)、形狀與方向(由協(xié)方差矩陣控制,可靈活表征球體、橢球體等不同形態(tài))、顏色(基于球諧函數(shù)的視角相關(guān)顏色,支持真實光照下的色彩變化)以及不透明度(控制該基元對最終圖像的貢獻權(quán)重)。與傳統(tǒng)三維重建技術(shù)的表征方式不同,3DGS采用顯式表示方案——所有高斯基元的參數(shù)均為直接可調(diào)的顯性數(shù)據(jù),而非NeRF等隱式方法依賴的神經(jīng)網(wǎng)絡參數(shù),這一特性使其具備更強的可控性與編輯性,同時為并行計算優(yōu)化提供了基礎。其核心優(yōu)勢集中體現(xiàn)在三個維度:一是實時渲染能力,通過基于GPU的并行光柵化流程(如CUDA加速),3DGS在RTX 4090等主流硬件平臺上可實現(xiàn)120fps以上的實時渲染,較傳統(tǒng)NeRF技術(shù)提升百倍級速度,徹底解決了神經(jīng)渲染“慢渲染”的行業(yè)痛點;二是高保真重建精度,通過高斯基元的精細參數(shù)優(yōu)化與自適應密度控制,能夠精準捕捉場景的幾何細節(jié)(如文物浮雕、建筑紋理)與光照特性,重建效果可媲美頂級NeRF模型,支持8K級視覺保真度輸出;三是輕量化與高效性,顯式存儲結(jié)構(gòu)避免了隱式表示的高內(nèi)存消耗,模型通常以.ply或.splat格式存儲,體積壓縮至MB量級,同時支持數(shù)據(jù)壓縮與分層加載,極大降低了存儲與傳輸成本,適配云端渲染與移動端部署需求。3DGS的完整實現(xiàn)流程是一套端到端的閉環(huán)系統(tǒng),涵蓋從數(shù)據(jù)輸入到模型輸出的全鏈路優(yōu)化,核心可分為七個關(guān)鍵步驟:第一步是數(shù)據(jù)預處理與初始化,通過SfM(運動恢復結(jié)構(gòu))技術(shù)(如COLMAP工具)對輸入的多視角RGB圖像序列進行處理,估計相機位姿(內(nèi)參與外參)并生成場景的初始稀疏點云,這一步為后續(xù)高斯基元的構(gòu)建提供了空間基準;第二步是高斯基元建模,將初始稀疏點云轉(zhuǎn)換為初始的3D高斯橢球體集合,為每個高斯基元分配初始參數(shù)(位置繼承自點云坐標,形狀與顏色進行初始,形狀與顏色進行初始賦值);第三步是視錐體篩選,根據(jù)當前相機的拍攝參數(shù),動態(tài)剔除位于視場范圍之外的高斯基元,減少無效計算,提升渲染效率;第四步是可微分投影,將保留的3D高斯基元通過仿射變換投影至二維圖像平面,建立三維空間與二維像素的映射關(guān)系,這一過程具備可微分特性,為后續(xù)參數(shù)優(yōu)化提供梯度傳遞路徑;第五步是分塊光柵化,將投影后的高斯基元按圖像塊(瓦片)組織,通過專用光柵器實現(xiàn)并行、有序的混合渲染,每個像素的最終顏色由其覆蓋范圍內(nèi)所有高斯基元的顏色與不透明度加權(quán)累加得到,形成類似“顏料潑濺”的融合效果,這也是“Gaussian Splatting”命名的由來;第六步是損失計算與反向傳播,通過對比渲染圖像與真實輸入圖像的差異(如均方誤差損失),利用梯度下降算法(如Adam)反向優(yōu)化所有高斯基元的參數(shù),不斷提升重建精度;第七步是自適應密度控制,這是3DGS提升細節(jié)表現(xiàn)力的關(guān)鍵創(chuàng)新——在訓練過程中動態(tài)執(zhí)行高斯基元的分裂、克隆與剪枝操作:對細節(jié)豐富區(qū)域的高斯基元進行分裂,生成更多精細基元;對冗余區(qū)域的基元進行合并或刪除,在保證細節(jié)的同時控制基元數(shù)量,實現(xiàn)場景的自適應精準建模。