-
题名基于关键视图的文本驱动3D场景编辑方法
- 1
-
-
作者
张冀
崔文帅
张荣华
王文彬
李亚琦
-
机构
华北电力大学计算机系
河北省能源电力知识计算重点实验室
复杂能源系统智能计算教育部工程研究中心
-
出处
《图学学报》
CSCD
北大核心
2024年第4期834-844,共11页
-
基金
河北省科技计划资助项目(22310302D)。
-
文摘
基于去噪扩散模型的零样本图像编辑方法取得了瞩目的成就,将之应用于3D场景编辑可实现零样本的文本驱动3D场景编辑。然而,其3D编辑效果容易受扩散模型的3D连续性与过度编辑等问题影响,产生错误的编辑结果。针对这些问题,提出了一种新的文本驱动3D编辑方法,该方法从数据端着手,提出了基于关键视图的数据迭代方法与基于像素点的异常数据掩码模块。关键视图数据可以引导一个3D区域的编辑以减少3D不一致数据的影响,而数据掩码模块则可以过滤掉2D输入数据中的异常点。使用该方法,可以实现生动的照片级文本驱动3D场景编辑效果。实验证明,相较于一些目前先进的文本驱动3D场景编辑方法,可以大大减少3D场景中错误的编辑,实现更加生动的、更具真实感的3D编辑效果。此外,使用该方法生成的编辑结果更具多样性、编辑效率也更高。
-
关键词
扩散模型
文本驱动
3d场景编辑
关键视图
数据掩码
-
Keywords
diffusion model
text-driven
3d scene editing
key views
data mask
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-