GCL学术成果:CVPR 2026-Easy3E:基于体素流的前馈式3D数字资产编辑-破解“效率-一致性”困局
近日,CVPR 2026接收成果出炉,来自中国科学技术大学数学科学学院GCL实验室的张举勇、郭玉东团队提出全新前馈3D编辑框架——Easy3E,将结构化潜空间与修正流编辑相结合。该方法告别了耗时的迭代优化,仅需单个视角下的二维编辑图像作为输入,通过前馈推理便可实现高质量的三维数字资产编辑效果,极大地提升了编辑效率。

从现有缺陷到新探索:3D资产编辑的困局
在游戏、影视等3D资产创作管线中,创作者通常需要对已有3D模型进行局部修改或重绘。现有的主流3D编辑方法主要分为两类,但始终面临着效率与一致性的难题:
1.基于2D先验的迭代优化(如SDS损失):在3D表征上进行逐场景的迭代优化。这种方式耗时极长,严重阻碍了创作效率,且经常受到多视角不一致的困扰,容易导致几何崩塌的问题。
2.基于多视图生成模型的微调:尝试在2D层面同步修改多视角图像,再重建三维模型。这类方法往往难以保证严格的3D结构对齐,导致最终编辑的模型细节丢失。
破局:Easy3E重构3D演化轨迹
针对上述难题,团队提出了Easy3E框架。该框架致力于解决一个核心问题:如何实现兼顾速度、三维一致性与高保真细节的3D资产编辑?
Easy3E的核心观察在于跳出了传统的“优化”与“2D提升至3D”的思路,直接在3D原生生成模型(如TRELLIS)的结构化潜空间中进行源资产到目标资产的过渡。具体而言,Easy3E将3D几何的修改过程,显式地建模为一条基于修正流(Rectified Flow)的演化轨迹。这种设计将复杂的3D资产编辑转化为一次高效的潜空间前馈推理,在大幅提升处理速度的同时,保证了生成结果的三维一致性。

图1. Easy3E对3D资产进行几何与纹理编辑的结果。
拆解难题:体素生成阶段的精准流编辑
Easy3E借鉴图像编辑方法FlowEdit的思想,将3D编辑转化为:在“源形态”与“目标形态”之间构建一条全新的生成轨迹。为了将这一思想真正在3D潜空间中落地,Easy3E在稀疏体素生成阶段进行了两项关键设计:
1.构建流编辑速度场:在生成过程的每一个时间步中,计算模型在“目标条件”与“源条件”下的速度场差异,然后利用这一速度差异,通过逐步求解的积分计算,持续更新当前的体素特征。这种步步推进的底层计算,显式地建立了两者的演化联系,驱动源几何平滑地“流向”目标几何。
2.引导流正则化:直接在复杂的三维空间中照搬二维FlowEdit的速度场,极易导致几何结构变形或彻底崩溃。为此,Easy3E提取目标视角的2D轮廓作为显式的边界约束,构建能量函数与矫正项。它在推理时充当动态导航:一旦特征演化出现溢出轮廓的趋势,立即动态矫正方向,将其拉回正轨。
细节雕琢:SLAT结构的无痕重绘
在确定了整体的3D稀疏体素结构后,下一步是补充精细的几何细节。为保证局部修改不破坏原有的背景结构,Easy3E采用了一种高效的掩码重绘策略来解耦空间:对于编辑区域,系统由目标条件引导,生成全新的局部特征;对于非编辑区域,系统则提取源资产的原始隐式特征,并将其精确加噪至当前对应的扩散时间步,以此来替换并锚定背景特征。这种基于时间步的加噪与替换策略,高效地保证了生成的几何细节过渡自然。
最终打磨:法向引导的高保真纹理生成
结构雕琢完毕后,最后一步是生成高保真纹理细节。针对3D原生生成模型在潜空间解码后极易出现的纹理模糊问题,Easy3E引入了法向引导的多视图纹理生成模块。该模块将几何编辑后的网格渲染为多视角法线贴图,将其作为显式的空间约束,指导扩散模型生成贴合编辑后几何的多视角图像。最终,将这些高质量的多视角图像反投影融合至纹理UV空间中,实现高保真纹理生成。

图2. Easy3E的整体框架概述。
结果展示:视觉保真度与生成效率的全面跃升
研究团队在多种类别的3D资产数据上进行了评估。结果表明,Easy3E在几何一致性和纹理保真度上超越了现有SOTA方法。对比迭代优化类方法,Easy3E将耗时从“几十分钟”缩短至“分钟级”,同时保留了三维模型结构的完整性。

图3:Easy3E与主流3D编辑方法在视觉质量上的对比。

图4:Easy3E与最新3D编辑方法在视觉质量上的对比。
总结与展望
Easy3E为3D资产编辑与内容创作管线提供了一种全新的思路。通过将结构化潜空间与体素流编辑相融合,使3D编辑具备了“前馈式生成”的能力,有效缓解了已有方法依赖迭代优化的计算负担,在提升编辑速度的同时,兼顾了几何结构的精准性与外观纹理的保真度。同时,该框架具有良好的通用性,为未来大规模3D/4D资产的交互式编辑,以及高保真数字资产在游戏与影视管线中的高效生产,提供了一条极具价值的探索路径。
论文发表
该工作已被计算机视觉顶级会议 CVPR 2026 录用。CVPR 是计算机视觉与模式识别领域的顶级国际会议(CCF-A类),2026年录用率约为 25.42%。
论文原文
论文标题: Easy3E: Feed-Forward 3D Asset Editing via Rectified Voxel Flow
作者: 胡诗敏,魏远毅,查飞,郭玉东,张举勇
单位: 中国科学技术大学