GCL学术活动:CVPR OpenDay 论文交流会成功举行

2026年3月4日,中国科学技术大学(USTC)GCL实验室在东校区第五教学楼举办了“GCL CVPR OpenDay”论文交流会。本年度,GCL实验室共有11篇研究工作被计算机视觉国际顶级会议CVPR 2026录用。为增进实验室内部的学术交流,并向全校师生展示在三维重建、生成模型、点云处理、肖像动画等前沿领域的最新研究成果,实验室策划了本次OpenDay活动。活动吸引了校内多学科背景的师生参与,重点围绕计算机图形学与计算机视觉的交叉热点展开讨论,旨在通过直接的技术细节探讨,加强学术氛围建设并为低年级学生提供了解科研一线动态的机会。

报告1:面向高效渐进式点云去噪的动态跳跃网络

肖冬老师介绍了提升 3D 感知系统可靠性的点云去噪新方案。针对现有渐进式方法在非均匀噪声下计算冗余的问题,他们的论文提出了“动态跳跃网络(DSNet)”。该框架包含噪声鉴别器与路径决策函数,能够根据局部面片的噪声特征自适应确定最佳去噪路径。实验表明,该机制通过路径选择迭代实现了跨阶段跳跃,在抑制噪声的同时显著提升了几何保真度与计算效率,为 3D 感知任务提供了先进的技术支撑。

图片

报告2:基于个性化表征的高表现力肖像生成

王俊逸同学的报告聚焦于利用扩散模型生成电影级肖像视频的挑战。针对现有肖像生成中间信号(如二维关键点)难以刻画个体化细节的痛点,他介绍了一种高保真个性化头部表征。该表征能够有效解耦身份信息与表情细节,并结合表情迁移模块与 Diffusion Transformer (DiT) 生成器,实现了在复杂运动下的高表现力合成。实验结果显示,该方法在身份保持、表情准确性及时间稳定性方面均有显著提升,尤其擅长刻画肖像视频中的细粒度细节。

图片

报告3:通过解耦显式与隐式运动表示实现高表现力肖像动画

施羽翔同学的报告针对单张源图像驱动肖像动画中的高保真解耦控制难题。论文提出了 DeX-Portrait 方法,该方案将姿势建模为显式全局变换,将表情建模为隐式潜码,并构建了一套自监督训练框架。通过新颖的双分支机制与渐进式 CFG 策略,该方法成功实现了头部姿势、面部表情与身份特征的深度解耦。实验表明,该模型在保持身份一致性的同时,展现出优异的泛化能力与表现力,支持仅表情或仅姿态的独立编辑应用。

图片

报告4:支持多层级传输与渲染的渐进式 3D 高斯数字人

崔晋恺同学介绍了应对网络带宽与计算资源波动的全新 3D Avatar 表示方法——ProgressiveAvatars。该技术通过在模板网格上进行自适应隐式细分,构建了可动画的 3D 高斯层级结构。依托重要性排序算法,该系统支持根据屏幕信号动态分配计算资源,实现画质的平滑过渡与增量加载。这一研究为实时 XR 与沉浸式会议中的 3D 数字人高质量传输提供了兼顾效率与表现力的解决方案。

图片

报告5:基于修正体素流的高效前馈 3D 资产编辑

胡诗敏同学介绍的论文针对现有 3D 编辑方法依赖逐场景迭代优化且多视角不一致的痛点,提出了基于 TRELLIS 主干的高效前馈编辑框架 Easy3E。该框架通过引入“Voxel FlowEdit”流模型,在稀疏体素潜空间中实现了单次前馈的全局一致变形。同时,结合法向引导的多视角生成模块修复高频纹理,该方法在保持高保真细节的同时,显著提升了 3D 模型编辑的效率与一致性。

图片

报告6:面向刚性配准的双空间过滤与强化范式

李嘉怡同学探讨了噪声与部分重叠数据给刚性配准带来的实时性挑战。她分享了“DualReg”双空间范式,将基于特征的全局匹配与基于局部几何的精细对齐相结合。通过高效的 1-point RANSAC 过滤机制与定制求解器,该方法在保持高精度的同时,在 KITTI 数据集上实现了较现有方法高达 32 倍的 CPU 加速,有效平衡了配准的鲁棒性与计算性能。

图片

报告7:具有空间一致性的三维电子显微镜图像分割

黄亦铠同学报告的论文针对三维电子显微镜(3D-EM)数据分割中空间一致性差且依赖大量人工标注的难题,提出了 Spatial-SAM 框架。该研究创新性地引入了基于 3D U-Net 预计算的符号距离场(SDF)记忆模块,为分割模型提供丰富的几何先验。通过结合少样本学习与双轨伪标签迭代优化策略,该方法在显著降低标注成本的同时,达到了与全监督前沿方法相当的性能,为大规模生物医学影像的高效处理提供了新路径。

图片

报告8:基于泊松无缝融合的高保真生成式网格模型编辑

来自合肥安生学校高中部的胡锦程同学介绍了名为 CraftMesh 的高保真网格模型编辑方法。针对现有生成式编辑在复杂模型上难以保留细节的问题,论文提出将 2D 图像编辑能力与 3D 模型生成深度结合。该方法通过在 SDF 表征下进行联合几何与纹理融合,实现了泊松几何混合与纹理协调,从而在保持原始网格结构自然性的同时,赋予了编辑区域更丰富的局部细节与外观表现力。【注:一作胡锦程同学为合肥安生学校高三学生,该论文为其获得2025年丘成桐中学科学奖(计算机科学)全球银奖的研究工作,详细报道见:GCL指导竞赛获奖:刘利刚教授与蔡有城博后指导高三学生胡锦程同学荣获丘成桐中学科学奖(计算机)全球银奖

图片

报告9:基于紧凑神经表示的动态全局光照随机访问压缩

林文浩同学的报告针对动态全局光照数据体量巨大、实时渲染访问代价高的问题,他们提出了一种基于紧凑神经表示的时序多光照贴图压缩方法。该方案将不同时间与光照条件下的贴图统一编码至神经网络中,并与虚拟纹理系统深度结合,实现了分块管理与按需解码。该技术在将解码开销控制在极低水平的同时,能够重建出高质量的间接光照与阴影效果,为大规模时序光照数据的存储与实时利用提供了兼顾压缩率与渲染性能的可行方案。

图片

报告10:面向流式三维重建的即插即用时空感知缓存压缩框架

宋宇轩同学介绍了 STAC 框架。针对因果变换器在流式 3D 重建中 KV 缓存线性增长的内存瓶颈,该研究通过设计工作时间令牌缓存、长期空间令牌缓存及分块多帧策略,充分利用了因果变换器固有的时空稀疏性。实验结果显示,该框架在无需额外训练的前提下,将内存消耗降低了 8.5 倍,推理速度提升了 3.5 倍,同时保持了 SOTA 级别的重建与位姿估计精度,为受限内存下的 3D 感知建立了统一范式。

图片

报告中的自由交流环节,参会师生就报告中的技术细节、实验设置以及未来可能的研究方向展开了深入探讨,报告者们针对大家提出的疑问进行了详尽解答。通过本次 OpenDay 活动,不仅展示了 GCL 实验室在三维视觉与图形学领域的最新科研成果,也为校内对 AI 前沿技术感兴趣的同学搭建了宝贵的学术交流平台。最终,本次报告会在听众热烈的掌声中完美落幕。