GCL学术活动:参加国际计算机图形学大会SIGGRAPH Asia 2024
北京时间2024年12月3日至12月6日,第17届SIGGRAPH Asia在日本东京隆重召开。这项年度会议自2008年创立以来,一直致力于展示计算机图形学与交互技术领域的前沿成果。作为亚洲地区最具影响力的国际会议之一,本次大会吸引了来自全球的顶尖学者、行业专家和研究人员齐聚一堂,共同探讨前沿技术与创新成果。
GCL实验室共有6篇文章被接收,其中4篇发表在该领域唯一的一区TOP期刊ACM Transactions on Graphics上(2024年第6期),该期刊2023-2024年度影响因子为7.8,是计算机科学与软件工程领域的一区刊物之一。6篇论文的作者们受邀参与并作论文报告,展示了实验室在计算机图形学领域的最新研究进展。GCL实验室的十余位师生以及从GCL实验室毕业的校友们共二十余位师生参加了本次盛会。
Technical papers
SIGGRAPH Asia近年来的论文提交数量持续增长,今年共提交了900篇论文,涵盖几何建模、视频成像、可视化和动画模拟等多个主题,其中几何/建模占比28%,可视化/渲染占比19%。此次大会最终接纳了146篇会议论文和119篇期刊论文,总接受率29.4%。GCL实验室共有6篇论文被SIGGRAPH Asia 2024接收,并受邀在大会做论文的口头报告。
Fast forward
第一天上午的Fast forward环节可以快速浏览所有此次会议接收的文章。每篇论文的作者上台展示一段不超过20秒的视频来介绍论文,以便吸引听众去参加他们的论文报告。
Presentations
详细的论文汇报在12月3日至12月6日分组举行,根据论文的主题分为不同的小组,每个小组有六篇文章。GCL实验室的6篇论文作者分别进行了汇报。报告过程中,团队详细阐述了理论模型的构建、算法设计与数据验证的全过程,并分享了实际应用场景中的实验效果。台下观众兴趣浓厚,现场反响热烈,提出了许多富有启发性的问题并与团队展开深入讨论。
1.郭佳鹏同学做了题为“Exact and Efficient Intersection Resolution for Mesh Arrangements”的报告,介绍了一种精确且高效的三角网格相交消除方法。该方法包含两个关键部分。首先,作者引入了一种名为“间接偏移谓词”的新型几何谓词,通过新的公式表示所有交点,并建立了所有必要的几何谓词,从而减少了浮点运算中的数值误差,提高了算术过滤早期阶段的成功率。其次,作者开发了用于交点排序去重和定位的局部化与降维技术,在保持准确性的同时显著提升了算法的效率和并行性。通过严格测试,验证了算法的鲁棒性及其与现有方法结果的一致性。综合多种数据集的测试结果进一步表明,该方法在速度上相较当前最先进的方法提升了一个数量级。
2.黄国晋同学做了题为“Stochastic Normal Orientation for Point Clouds”的报告,介绍了一种简单而有效的点云法线定向方法。方法的核心是结合全局和局部信息来定义一个新的优化目标函数:在全局上,我们引入一个带符号的不确定性函数来区分曲面的内部和外部;受益于全局项的统计不确定性信息,定向估计可以用局部估计来替代。这个优化问题可以通过常用的数值优化求解器求解,例如L-BFGS。作者通过对各种复杂点云的实验,展示了该方法的能力和可行性,相比于现有的最先进方法,该方法在实际应用中表现出更高的鲁棒性和法线质量。
3.陈柯同学做了题为“mpcMech: Multi-Point Conjugation Mechanisms”的报告,介绍了一种通过多点共轭精确传递用户指定运动的机械结构:mpcMech。作者将共轭曲面理论与形封闭抓取理论建立联系,提出了动态形封闭条件;在此条件下,一个共轭曲面通过多点共轭能够连续不断地将运动传递给另一个共轭曲面。基于此条件,作者提出了一种基于优化的方法来建模多点共轭机构的几何,以精确生成用户指定的复杂运动;该方法适用于一维、二维或三维的运动空间。该方法的核心在于对满足多点共轭、动态形封闭和可制造性等要求的多对共轭曲线进行建模。作者通过对不同类型的多点共轭机构建模并生成各种运动、使用3D打印原型评估机构的运动学性能、以及展示了三个应用实例,展示了该方法的有效性。
4.林哲晖同学做了题为“Polynomial Cauchy Coordinates for Curved Cages”的报告,介绍了一种新的多项式Cauchy坐标,用于计算曲线区域上的形状变形。该方法通过使用分段Bézier曲线表示域的边界,成功将复值Cauchy重心坐标推广到曲线边界的情况,与现有的Polynomial 2D Green坐标相比,该方法获得了等效的结果。此外,作者推导了坐标的n阶导数表达式,以及基于Cauchy积分公式的逆映射数值积分公式,使得通过中间步骤实现曲线笼子之间的变形成为可能。该方法的优势在于可以直接使用曲线笼子作为输入,提高了输入的灵活性。论文通过大量实验展示了该坐标在交互式变形中的多功能性和有效性。
5.高玄同学做了题为“Portrait Video Editing Empowered by Multimodal Generative Priors”的报告,介绍了PortraitGen框架,给定一个人像视频,基于多模态提示词实现高质量人像视频编辑。之前的人像视频编辑方法的编辑结果往往有时域不连续、三维不一致的问题,并且视频渲染质量和效率也不能让用户满意。为了解决这些问题,这篇文章将二维的人像视频提升到四维的高斯场中,以此确保了帧之间的时间连续性和三维一致性。此外,这篇文章设计了一种神经高斯纹理机制,不仅使复杂的风格编辑成为可能,还实现了超过100FPS的渲染速度。通过从多模态生成式大模型中蒸馏编辑先验知识,这一工作实现了高质量的基于文本编辑、基于图片编辑、以及人像重打光等应用。
6.蔡有城博士后做了题为“MV2MV: Multi-View Image Translation via View-Consistent Diffusion Models”的报告,介绍了一个基于扩散模型的统一的多视图图像到多视图图像转换框架MV2MV。首先,该方法提出了一种新的自监督训练策略,利用现成的单视图图像转换器和3D高斯飞溅(3DGS)技术的成功来生成伪GT作为监督信号,从而增强一致性和精细细节。其次,提出了一个潜在多视图一致性模块,它利用潜在的3DGS作为底层的3D表示来促进跨多视图图像的信息交换,并将3D先验注入到扩散模型以增强一致性。最后,提出联合优化策略,能够在一致性和真实性之间实现更好的权衡。在各种图像转换任务中进行的大量实验表明,MV2MV在定量和定性方面都优于现有方法。
Technical Papers Interactive Discussion
在 SIGGRAPH Asia 的技术论文互动讨论环节中,技术论文的作者将展示他们在计算机图形学、交互技术及相关领域的创新工作。此环节以技术报告、现场演示和开放讨论的形式相结合,为与会者提供了直接与研究者互动的宝贵机会。
参与者不仅可以提问和探讨研究的实际应用,还能够深入了解论文中提出的技术挑战与解决方案。这种互动形式促进了动态交流,帮助与会者更全面地理解研究成果,同时为计算机图形学社区的潜在合作创造了契机。
Best Paper Award
作为SIGGRAPH近几年新设的奖项,以下论文因其研究的突出性以及对计算机图形和交互技术的贡献而被评选为最佳论文奖:
-
Université Claude Bernard Lyon 1的Bastien Doignies的“Differentiable Owen Scrambling”工作提出了一种可微分的Owen扰动算法,不仅严格保持输入点集的低离散性特性,还能优化多种均匀性准则,从而显著提升积分收敛率和点集质量。
-
ETH Zurich的Yuxiao Zhou的“GroomCap: High-Fidelity Prior-Free Hair Capture”工作提出了GroomCap,一种无需外部数据先验的新型多视图头发捕获管线,创新性地结合隐式体积表示、基于射线的体积方向渲染算法以及链式高斯头发优化,实现了高保真、根部连接且适用于多种发型的精确头发几何重建。
-
University of California, Los Angeles的John Flynn的 “Quark: Real-time, High-resolution, and General Neural View Synthesis”工作提出了一种实时的视图合成算法,通过结合分层深度图(LDM)场景表示、多尺度学习的渲染与优化网络核心以及基于Transformer的输入视图融合,实现了高质量新视图生成并显著提高了重建与渲染的效率。
-
Cornell University的Yunchen Yu的 “Appearance Modeling of Iridescent Feathers with Diverse Nanostructures”工作通过快速波动光学模拟器和基于BRDF分布的外观建模方法,精准再现了生物虹彩羽毛的空间变化光泽特性,并支持多尺度高效渲染。
-
Snap Inc 的Jian Wang的“Perspective-Aligned AR Mirror with Under-Display Camera”工作通过提出适用于透明显示屏下相机的图像生成模型,首次系统化地解决了大尺寸AR镜面中的视角失配问题,并设计了高效的图像重建算法和实时AR镜面系统,显著提升了用户体验。
-
Georgia Institute of Technology的Zhiqi Li发表的“Particle-Laden Fluid on Flow Maps”提出了一种统一的欧拉-拉格朗日粒子流映射求解器,通过新颖的路径积分公式和黏性拖曳力处理机制,实现了全Navier-Stokes方程与颗粒相互作用的模拟,从而在墨水扩散的复杂流体特性模拟中达到当前最先进的水平。
Test-of-Time Award
“Test-of-Time"奖项是为了表彰在十年或者更久的时间里对计算机图形和交互技术产生重大影响的论文,论文如下:
-
目前在The Ohio State University的Brian Guenter于2012年在Microsoft research发表的“Foveated 3D Graphics”工作首次将多分辨率的注视点依赖渲染应用于交互式3D图形,通过在外周区域进行子采样并采用高效的抗锯齿策略,显著提高了渲染性能。此外,文章还深入分析了系统组件之间的延迟,并通过用户研究验证了其方法能够避免不良伪影,达到了与非注视点渲染相当的质量。这一方法为减少渲染资源消耗并提高图形处理效率提供了新的解决方案,推动了注视点渲染技术在计算机图形学领域的应用。
-
香港中文大学的徐立(目前是商汤科技的CEO)于2012年发表的“Structure Extraction from Texture via Relative Total Variation”工作提出了一种基于新的局部变化度量的纹理去除方法,通过不同方式对纹理和结构进行惩罚,从而有效地分离并提取图像中的“结构+纹理”元素。这一方法无需假设纹理的特定规律或对称性,能够处理非均匀和各向异性的纹理,为图像编辑、渲染和结构检测等应用提供了强大的支持,对图像处理领域产生了深远的影响。
-
Max Planck Institute for Intelligent Systems 的Matthew Loper 于2014年发表的“MoSh: Motion and Shape Capture from Sparse Markers”工作提供了一种全自动的方法,从稀疏的标记集捕捉逼真的身体形状、姿势和软组织运动,显著提高了运动捕捉(mocap)数据的真实感,而无需使用大规模标记集或专门的硬件。这个方法能够更加自然地生成动画,使得运动捕捉数据更具细腻感和生命力,尤其在动画和电影制作领域中对逼真人体动作的需求上具有重要影响。通过解决软组织变形的问题并提供高效的身体形状和姿势捕捉解决方案,MoSh 对运动捕捉领域产生了深远的影响,使其在多种应用中更加可访问和适应。
Posters Gallery
在 SIGGRAPH Asia 2024 的 Posters Program 中,深入探索计算机图形学的最新动态。这一互动式论坛汇聚了来自全球动画师、开发者、教育工作者和研究人员的前沿创意与实用贡献。每一张海报都以简洁直观的形式展示了动画、渲染、机器学习、虚拟现实等多领域的宝贵见解,展现了计算机图形学不断发展的多样化图景。
今年的主题为“Curious Minds”(好奇的心灵),激励参与者探索新兴技术趋势,无论是了解商业作品背后的创作过程,还是寻找复杂问题的解决方案,Posters Program 都为每位与会者提供了启发与交流的机会。
这些海报不仅展示最新的研究成果,其作者也会亲临现场,详细解答观众问题,分享他们的工作,并接受反馈,与参会者进行深入的学术交流和人脉拓展。
Exibition & Emerging technologies
在SIGGRAPH Asia 2024 的 Emerging Technologies展览上,踏上一段充满魅力的“超越边界”之旅,感受创新无极限的未来世界!作为本次大会的亮点之一,Emerging Technologies 是展示全新交互技术的顶级平台,为观众带来启发、惊喜与未来科技的独特体验。
展览汇集了从沉浸式虚拟现实到前沿人工智能和机器人技术的最新突破,通过引人入胜的演示为观众呈现未来的科技图景。
参与者将有机会近距离接触尖端原型,体验新技术的震撼潜力。同时,现场还将邀请专家进行互动讨论,帮助与会者深入了解未来技术的趋势与创新价值,激发更多灵感和思考。
展望未来,再创辉煌
GCL实验室有20余位GCLers参加了本次SIGGRAPH Asia盛会,在大会上汇报了6篇论文论文,充分展现了GCL实验室在计算机图形学领域的科研深度与创新实力。未来,GCL实验室将继续致力于科学研究与技术突破,积极推动相关技术在工业界与学术界的应用,力争为全球计算机图形学的发展作出更大的贡献。东京之行随着红叶飘下已落幕,但创新的步伐永不停歇。期待GCLers在未来更多国际顶级会议上的精彩表现!