GCL学术成果:SIGGRAPH 2026-Mobile3DGS³ : 基于梯度感知超采样和帧插值的移动端3DGS渲染加速

近日,SIGGRAPH 2026 接收成果公布,来自中国科学技术大学数学科学学院 GCL 实验室的刘利刚研究团队提出了一种面向移动端3DGS渲染的加速方法—— Mobile3DGS³。该方法从后处理的角度重新审视移动端3DGS渲染加速问题,并将缓存为高斯球参数的3DGS渲染图的微分用于指导超分与插帧,从而实现在保证视觉质量的前提下的有效加速。

不同于现有加速方法对高斯剪枝或对渲染管线进行优化,我们受现代实时渲染中后处理模块(DLSS、XeSS、FSR等)启发,利用超分于插帧技术在移动端设备上进行渲染加速。同时,该方法提出将蕴含了丰富细节信息的3DGS渲染图的微分缓存为切空间中的的不变量,确保微分图计算与硬件光栅化管线兼容,进而可将其用于指导更高质量的超分与插帧。

图片
图1:Mobile3DGS³利用缓存梯度进行超分与插帧,实现移动端3DGS渲染加速

一、移动 3DGS 渲染:从性能瓶颈到体验革命

移动平台已成为 VR/AR、游戏、数字孪生等沉浸式 3D 应用的主要载体安徽省图形计算与感知交互重点实验室。随着现代移动设备高刷新率、高分辨率屏幕的普及,用户对实时渲染质量和流畅度的要求日益增长。然而,移动设备有限的 GPU 性能和严格的功耗预算,始终是制约沉浸式体验的核心瓶颈。

3DGS技术自 2023 年提出以来,凭借其照片级的渲染质量和实时渲染能力,彻底改变了三维重建与新视角合成领域。但 3DGS 庞大的参数密度和计算开销,使其在移动设备上的部署面临巨大挑战。现有 3DGS 加速方法主要集中在两个方向:(1) 高斯剪枝:通过移除冗余高斯基元减少计算量,如 LightGaussian、Mini-Splatting 等。(2) 渲染管线优化:通过硬件加速和光栅化改进提升效率,如 Sort-free GS、Mobile-GS 等。这些方法虽然显著降低了移动 GPU 上的渲染开销,但都可归结于对渲染管线内的优化,在现代实时渲染中常用的后处理加速方法在移动端3DGS加速任务中的潜力尚未被充分探索。

二、现有方法的核心矛盾:后处理加速与 3DGS 特性不匹配

现代实时渲染后处理技术(DLSS、XeSS、FSR等)通过从低分辨率或稀疏渲染的输入中重建高分辨率、高帧率图像,能够直接降低每帧渲染成本,同时保持视觉质量。

不过,直接将传统后处理方法应用于 3DGS 渲染往往会导致明显的视觉退化。这主要是因为:(1) 传统方法依赖精确的 G-buffer 信息,而 3DGS 的连续体积基元表示与网格场景有本质区别; (2) 现有方法未能充分利用 3DGS 固有的平滑空间连续性和可微性特性:近期工作表明,3DGS 支持图像微分的解析计算,能够忠实保留图像细节,为高保真图像重建提供了巨大潜力。但解析计算方案与移动设备上的硬件加速光栅化管线不兼容,无法直接应用于移动平台。

由此可见,利用后处理技术加速移动端3DGS渲染面临两个关键挑战: (1) 如何高效地从硬件加速光栅化的 3DGS 渲染中获取微分信息 (2) 如何设计轻量级、NPU 友好的模型,在移动设备上实现高效的超采样和帧插值。

三、Mobile3DGS³:梯度感知的后处理加速框架

Mobile3DGS³的思想为:将微分图进行缓存,并将其用于指导3DGS的渲染图的超分与插帧。算法流程如图2所示。利用3DGS渲染的深度图和法线图,构建图像空间像素值微分和切空间虚拟的材质函数的微分的映射关系。借以后者的视角无关性,可将其缓存为高斯球参数,并在渲染时利用Alpha Blending获取,从而在兼容硬件光栅化管线的前提下获取3DGS渲染图的微分。获取到的微分图将与低分图片、渲染几何一同送入针对移动端NPU算子亲和化设计的超分(GASS)与插帧(GAFI)模块中,产生高质量高分辨率结果。

图片
图2:Mobile3DGS³ 算法流程框架

算法框架中的核心在于切空间梯度缓存(TSGC)。3DGS渲染的深度𝑫&法线𝑵可以定义出一个曲面S={r(u,v)},我们做以下假设:某一点𝑝看到的颜色相当于曲面𝑺上材质函数𝒇在该点的取值。在此基础上,对于渲染视角其渲染图像的Jacobi矩阵 (像素值相对于𝑥,𝑦的偏导)可由相机参数(焦距,外参旋转平移,与材质函数的微分相关联。由于在移动端3DGS渲染中,原本由球谐函数表达的方向相关的颜色被方向无关的三分量RGB替代,因此可以认为时视角无关的,进而可以由Alpha Blending获取。也正因这样的视角无关性,插帧视角可以在对齐后复用于获取的切空间梯度,实现对插帧的指导。

图片
图3:切空间梯度缓存 (TSGC)

四、实验结果:忠于高分渲染结果,实现帧率提升

我们在MipNeRF360、Tanks and Temples、Deep Blending数据集上进行了系统实验,并在Kirin 9020 SoC 上完成了端到端部署验证。实验结果表明,Mobile3DGS³ 可以在忠于原生高分渲染结果的前提下,实现帧率的有效提升。

从质量量化结果来看,本文方法同时完成4 倍超采样(640×360→2560×1440)+ 帧插值的联合任务,在更低输入分辨率、更复杂任务目标下,视觉质量与当前最优方法相当。同时,从消融实验中可以发现,梯度缓存机制起到了重要的作用,为质量的提升提供了较大的贡献。

图片

图片
图4:质量定量结果。(左图) 对比实验结果;(右图) 消融实验结果。

除量化指标外,定性结果亦进一步验证了Mobile3DGS³方法的有效性。相较于其他的方法,我们的结果更忠实于原生高分辨渲染结果,并且可有效缓解因采样率不足导致的混叠问题。这正是因为我们有效地利用了3DGS的可微性质,为后处理任务加入了更充分的先验信息。

图片
图5:质量定性对比图

五、总结与展望

Mobile3DGS³ 的核心贡献在于提出了一种全新的移动端 3DGS 加速范式。与以往优化 3DGS 渲染管线内部的方法不同,Mobile3DGS³ 从后渲染技术角度出发,利用缓存在高斯球中的切空间梯度,打通了3DGS微分图计算与硬件光栅化管线之间的壁垒,并将其用于指导高效的超分与插帧。未来可进一步将Mobile3DGS³与无排序渲染方法相互结合,二者可相得益彰,实现更进一步的加速。

论文发表 该工作已被计算机图形学顶级国际会议 SIGGRAPH 2026 接收。

论文原文

论文标题:Mobile3DGS³: Accelerate Mobile 3DGS Rendering via Gradient-Aware Super-Sampling and Frame Interpolation

作者:Fan Gao, Yibo Zhao, Changhao Song, Jiarui Wen, Yuxuan Song, Youcheng Cai, Ligang Liu

单位:中国科学技术大学

项目主页:https://github.com/SyouSanGin/Mobile3DGS3