CSIAM GDC “三维重建与三维生成” 研讨会


会议介绍

当前,三维视觉正迈向以“空间智能”为核心的新阶段,经历着从“看清世界”(重建)到“创造世界”(生成)的范式转变。随着世界模型与生成式人工智能技术的爆发,三维重建与生成技术已成为连接物理世界与数字孪生世界的关键桥梁。从自动驾驶的闭环仿真到三维游戏的内容创作,从高保真数字人的实时驱动到具身智能的感知决策,这些前沿技术正以前所未有的速度重塑着产业格局。

为探讨这一前沿领域的最新突破与未来趋势,本次研讨会邀请了八位来自学术界和工业界的技术专家,共同分享他们在三维重建、三维生成、智能驾驶、空间智能等方向的最新研究成果与落地经验。

注册参会

本次会议免收注册费,为了方便会议组织及入校报备,请填写报名表(注:会议报名截止时间为12月22日,科大在校师生与校友无需报名)。(点击此处跳转报名链接

会议安排

08:30-09:40 Session 1,主持人:张举勇
时间 讲者 单位 题目
08:30-08:40 李建方 阿里巴巴-通义实验室 3D数字人的生成和语音驱动
08:40-08:50 杨红庄 虹软科技 面向商业拍摄的可控AIGC
08:50-09:00 杜冬 南京理工大学 数据驱动的智能CAD生成
09:00-09:10 邓治 腾讯游戏 3D生成在游戏内容制作中的玩法
09:10-09:40 圆桌讨论
09:40-10:00 茶歇
10:00-11:10 Session 2,主持人:郭玉东
时间 讲者 单位 题目
10:00-10:10 夏熙 有鹿机器人 三维重建在自动驾驶中的应用 —— 从决策规划的视角
10:10-10:20 胡鑫 小鹏汽车 三维重建在自动驾驶中应用与展望
10:20-10:30 冯万泉 字节跳动 自回归交互式视频世界模型
10:30-10:40 要宇馨 香港城市大学 稀缺4D数据下的运动建模与生成
10:40-11:10 圆桌讨论

嘉宾报告

  • 题目: 3D数字人的生成和语音驱动

    讲者: 李建方,阿里巴巴-通义实验室

    摘要: 3D数字人在动画影视、IP广告、虚拟直播等行业有着广泛的应用,但是3D数字人的制作和驱动成本高昂。1. 我们提出了文生3D数字人的方案,通过一句话,简单的描述一下想要的3D数字人,就可以生成符合传统工业管线高品质的3D数字人。2. 我们利用采集/开源的动捕数据研发了语音驱动3D数字人的技术方案,只要输入语音就可以让3D数字人惟妙惟肖的动起来。

    个人简介: 李建方,2017年博士毕业于USTC-GCL实验室,现在阿里巴巴-通义实验室从事3D虚拟人方向的研发工作。


  • 题目: 面向商业拍摄的可控AIGC

    讲者: 杨红庄,虹软科技

    摘要: 商业拍摄领域对内容产出的精准性、一致性与高效性需求日益凸显,但传统拍摄模式长期受困于成本高企、周期冗长、创意迭代滞后等痛点,难以适配行业快速发展诉求。AIGC 技术的崛起为破解这一困境提供了创新路径。本报告聚焦商业拍摄场景下的可控 AIGC 应用,通过将结构化控制信号与生成模型深度融合,实现对商业拍摄内容中人物姿态、角色形象、场景布局及空间层次的精细化调控,为电商拍摄等核心场景提供高效、可控、低成本的内容生成解决方案,助力商业拍摄领域加速数字化转型,推动行业生产力质效升级。

    个人简介: 杨红庄,2016 年硕士毕业于 GCL 实验室,同年加入虹软科技股份有限公司,担任算法研究员,专注于3D 视觉领域算法研发与落地工作。


  • 题目: 数据驱动的智能CAD生成

    讲者: 杜冬,南京理工大学

    摘要: 近十多年来,人工智能(AI)方法在各个领域得到迅猛发展,但囿于CAD模型的高精度几何表示、复杂拓扑结构以及严格工程约束等特性,使得AI方法难以直接迁移到CAD任务。随着近两年国家战略层面对国产工业软件的高度重视,AI for CAD也迎来了发展契机,各类生成方法(如基于大语言模型的方法)被研究者们提出,以解决传统CAD专业性强、效率低下、创新受限等问题。本报告将从适配AI框架的多种CAD表示、数据集构建、建模方法等方面概括介绍现有工作,分享学习心得,并探讨存在的问题及挑战。

    个人简介: 杜冬,南京理工大学数学与统计学院副教授。2021年博士毕业于中国科学技术大学GCL实验室,师从刘利刚教授、香港中文大学(深圳)韩晓光教授、香港科技大学傅红波教授,随后在香港城市大学侯军辉教授课题组做博后,研究方向为计算机图形与三维视觉,包括交互式草图建模、三维服装建模、三维重建、智能CAD以及三维内容生成等,发表文章十余篇,担任SIGGARAPH Asia、CVPR、ICCV、ECCV、NeurIPS等会议以及TIP、TVCG、TCSVT、TMM、C&G等期刊评审,现任CCF-CAD&CG、CSAIM-GDC、CSIG-3DV、CSIG-智能图形专委委员、GAMES执委委员等。


  • 题目: 3D生成在游戏内容制作中的玩法

    讲者: 邓治,腾讯游戏

    摘要: 传统美术依赖于DCC工具(如Maya、ZBrush、Blender等)完成了3D内容的完整制作流程。如今,快速发展的AIG3D技术已在某些制作环节上实现了赋能与提效。本报告结合个人的学科背景及业务经验,对3D生成在游戏中3D内容制作流程中的应用进行分享。

    个人简介: 邓治, 中科大GCL 2023届博士,导师为张举勇教授,博士期间主要研究三维重建中的点云配准、多视角重建、数字人重建及基于草图的3D建模等相关问题。当前在腾讯游戏就职高级算法研究员,主要涉及物体级别的3D形状生成、3D网格拓扑生成、3D 场景布局生成及角色动画相关的研究与开发。


  • 题目: 三维重建在自动驾驶中的应用 —— 从决策规划的视角

    讲者: 夏熙,有鹿机器人

    摘要: 近年来,随着端到端自动驾驶与世界模型(World Model)的兴起,三维重建的应用进一步扩展到闭环学习与数据生成领域。以Gaussian Splatting 等可微重建技术为核心的高保真虚拟场景,正成为策略训练、数据增强与可解释调试的重要工具,使得决策规划能够在近真实质感的虚拟环境中进行大规模验证与泛化。本报告将梳理从传统 SLAM、高精地图,到结构化在线拓扑构建、Occupancy重建,再到基于Gaussian Splatting的可微场景生成等关键技术路线,重点分析决策规划对它们提出的精度、实时性、可编辑性、与规模化需求,并展望“重建—理解—规划”深度耦合的下一代自动驾驶架构,为自动驾驶与计算机图形学的交叉研究提供思考方向。

    个人简介: 夏熙,中国科学技术大学计算数学博士,期间师从刘利刚教授研究基于移动机器人的室内场景自主三维重建课题,发表SIGGRAPH论文多篇。毕业后加入阿里巴巴达摩院自动驾驶实验室,任决策规划算法工程师。历经校园小蛮驴快递车,公开道路小蛮驴外卖车,高速大蛮驴重卡等多个核型项目,积累了部分L4级别自动驾驶的量产经验。后加入具身智能初创公司有鹿机器人,深度参与开发了AI130商用巡扫机器人,在全国数百个园区(包含多处地标性园区)稳定运营两年多。


  • 题目: 三维重建在自动驾驶中应用与展望

    讲者: 胡鑫,小鹏汽车

    摘要: 关于自动驾驶技术路线选择上,纯视觉方案和多传感器融合方案一直以来都是人们激烈讨论的焦点,前者以Tesla、XPeng为代表,后者以华为、Waymo为代表。纯视觉方案成功的基本前提是拥有强大的视觉感知能力,而此能力高度依赖于视觉三维重建提供的海量高精度真值数据;此外,随着端到端大模型的快速发展,由视觉三维重建构建的仿真器也将发挥重要的作用,大模型-模拟器并行交错发展或许会是未来自动驾驶乃至具身智能技术演进的新范式。

    个人简介: 胡鑫,2018年硕士毕业于中国科学技术大学,2018-2023年加入大疆创新 (DJI) 任职计算机视觉算法工程师,2023年加入小鹏汽车任职自动驾驶算法专家,主要研究方向为视觉三维重建在自动驾驶中的应用。


  • 题目: 自回归交互式视频世界模型

    讲者: 冯万泉,字节跳动

    摘要: 交互式视频内容在游戏娱乐、虚拟现实、机器人仿真等行业有着广泛的应用。我的研究兴趣包括:(1)自回归视频生成,逐步扩展因果性、生成长度、记忆性等;(2)视频生成交互,包括镜头轨迹交互以及物体运动交互;(3)同时也关注更多落地应用,包括人像插入、换装、风格化等。我们成果发表了学术论文若干,也在原生AI平台上线。

    个人简介: 冯万泉,2022 年博士毕业于 USTC-GCL 实验室,现就职于字节跳动,从事视频生成与交互控制相关研发工作。


  • 题目: 稀缺4D数据下的运动建模与生成

    讲者: 要宇馨,香港城市大学

    摘要: 在三维视觉与图形学领域,4D动态场景及目标的建模与生成对于空间智能、虚拟现实、影视特效及机器人仿真等应用具有核心价值。然而,高质量的4D数据在现实中通常难以获取,其匮乏性严重制约了相关技术的发展,使得现有方法在进行高质量、时序一致、语义合理的4D生成任务上仍面临显著挑战。 本报告将分享我们为应对4D数据稀缺条件下的运动建模与4D内容生成所提出的一系列工作,通过设计更高效的运动表示方法与学习范式,以实现高质量的动态内容创造。

    个人简介: 要宇馨,2023年博士毕业于中国科学技术大学,导师为张举勇教授。现为香港城市大学博士后研究员,合作导师为侯军辉副教授。主要从事三维配准与重建,运动建模与动画生成等方面的研究,近年来在CVPR, ECCV, ICCV, T-PAMI等国际顶级计算机学术会议和期刊发表多篇论文。

组织机构