基于深度条件扩散模型的零样本文本驱动虚拟人生成方法

Zero-shot text-driven avatar generation based on depth-conditioned diffusion model

下载PDF

导出

摘要虚拟人生成技术对于虚拟现实和影视制作等领域有重要意义。针对现有虚拟人生成需要大量数据和制作成本等问题,提出一种基于扩散模型的零样本文本驱动的三维虚拟人生成方法,包括条件人体生成和迭代纹理细化2个阶段。第一阶段,首先利用神经网络初始化三维人体的隐式表示,然后,使用一个基于文本提示的深度条件扩散模型来引导神经隐式场生成用户所需的虚拟人模型。第二阶段,利用扩散模型进行去噪还原,针对第一阶段人体模型提供的纹理先验进行高精度的纹理图推理更新,进而迭代细化虚拟人的纹理表示,生成最终结果。使用该方法,用户可以创建一个生动的具有任意文本描述的虚拟人,而无需使用任何参考照片。实验结果表明,该方法可以在给定的文本提示条件下生成具有真实感的高质量、生动的虚拟人。 Avatars generation holds significant implications for various fields,including virtual reality and film production.To address the challenges associated with data volume and production costs in existing avatar generation methods,we proposed a zero-shot text-driven avatar generation method based on a depth-conditioned diffusion model.The method comprised two stages:conditional human body generation and iterative texture refinement.In the first stage,a neural network was employed to establish the implicit representation of the avatar.Subsequently,a depth-conditioned diffusion model was utilized to guide the neural implicit field in generating the required avatar model based on user input.In the second stage,the diffusion model was employed to generate high-precision inference texture images,leveraging the texture prior obtained in the first stage.The texture representation of the avatar model was enhanced through an iterative optimization scheme.With this method,users could create realistic avatars with vivid characteristics,all from text descriptions.Experimental results substantiated the effectiveness of the proposed method,showcasing that it could yield high-quality avatars exhibiting realism when generated in response to given text prompts.

作者王吉王森蒋智文谢志峰李梦甜 WANG Ji;WANG Sen;JIANG Zhi-wen;XIE Zhi-feng;LI Meng-tian(Department of Film and Television Engineering,Shanghai University,Shanghai 200072,China;Shanghai Film Special Effects Engineering Technology Research Center,Shanghai 200072,China)

机构地区上海大学影视工程系上海电影特效工程技术研究中心

出处《图学学报》 CSCD 北大核心 2023年第6期1218-1226,共9页 Journal of Graphics

关键词扩散模型虚拟人零样本文本驱动的生成深度学习 diffusion model avatar generation zero-shot text-driven generation deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1蔡兴泉,霍宇晴,李发建,孙海燕.面向太极拳学习的人体姿态估计及相似度计算[J].图学学报,2022,43(4):695-706. 被引量：5
2王玉萍,曾毅,李胜辉,张磊.一种基于Transformer的三维人体姿态估计方法[J].图学学报,2023,44(1):139-145. 被引量：3
3张小蒙,方贤勇,汪粼波,田利利,孙有为.基于改进分段铰链变换的人体重建技术[J].图学学报,2020,41(1):108-115. 被引量：3

二级参考文献9

1何露茜,何斌.一种基于多相机的多介质三维重建算法研究[J].数字技术与应用,2017,35(2):160-161. 被引量：2
2Masoud Zadghorban Lifkooee,Celong Liu,Yongqing Liang,Yimin Zhu,Xin Li.Real-Time Avatar Pose Transfer and Motion Generation Using Locally Encoded Laplacian Offsets[J].Journal of Computer Science & Technology,2019,34(2):256-271. 被引量：4
3范书瑞,贾雅亭,刘晶花.基于三轴加速度传感器人体姿态识别的特征选择[J].应用科学学报,2019,37(3):427-436. 被引量：14
4连仁明,刘颖,于萍,刘畅.基于视频的人体姿态检测方法及其应用综述[J].电脑编程技巧与维护,2019,0(9):127-129. 被引量：2
5沈栎,陈莹.带特征监控的高维信息编解码端到端无标记人体姿态估计网络[J].电子学报,2020,48(8):1528-1537. 被引量：3
6张显坤,张荣芬,刘宇红.基于二次生成对抗的人体姿态估计[J].激光与光电子学进展,2020,57(20):327-335. 被引量：4
7冯高敏,刘雨佳.基于视觉的对人员在岗行为分析的算法[J].计算机工程与设计,2021,42(6):1668-1676. 被引量：2
8周凯烨.基于深度学习的健身动作识别系统[J].工业控制计算机,2021,34(6):37-39. 被引量：2
9刘嘉宇,陈平.基于关键帧定位和时空图卷积的异常行为识别[J].机械与电子,2022,40(1):48-53. 被引量：4

共引文献8

1王巧丽,徐增波,田丙强.虚拟试衣中个性化三维人体建模的研究进展[J].纺织导报,2020(7):79-82. 被引量：9
2王栾栾,严群,姚剑敏,林志贤.基于SMPL模型人体三维重建算法研究[J].传感器与微系统,2022,41(10):59-63. 被引量：1
3程贝芝,伍鹏,寇静雯,何一鸣,谢凯,盛冠群.结合全局上下文信息的交警手势识别方法[J].中南民族大学学报（自然科学版）,2023,42(3):349-356. 被引量：2
4杨耿,梁俊威,蔡铁,李钦,郑家帆.新时代学校体育评价智慧大脑设计与构建研究[J].当代体育科技,2023,13(18):103-110. 被引量：2
5顾玉恒.基于改进YOLOv5的目标智能检测方法在罚球姿势中的应用[J].计算机测量与控制,2023,31(12):290-295.
6金海波,马琳琳,田桂源.自适应Transformer网络下的单幅图像去雾方法[J].计算机工程与应用,2024,60(3):237-245.
7杨旭升,吴江宇,胡佛,张文安.基于渐进高斯滤波融合的多视角人体姿态估计[J].自动化学报,2024,50(3):607-616.
8黄友文,林志钦,章劲,陈俊宽.结合坐标Transformer的轻量级人体姿态估计算法[J].图学学报,2024,45(3):516-527.

1白泽琛,姚乃明,刘璐,陈鹏,陈辉.基于加权混合融合变形的虚拟人情感表达[J].集成技术,2023,12(4):42-53. 被引量：1
2李静,尹伟石,孟品超.基于真实三维人体点云的特征参数提取[J].长春理工大学学报（自然科学版）,2024,47(1):131-136.
3无.高水平科技自立自强的重要支撑[J].人民论坛,2024(4):6-7.
4郑台台,姚燕,蔡晋辉.基于三维坐姿的压力数据自动标注方法[J].仪器仪表学报,2023,44(10):71-79. 被引量：1

图学学报

2023年第6期

浏览历史

内容加载中请稍等...

基于深度条件扩散模型的零样本文本驱动虚拟人生成方法

参考文献3

二级参考文献9

共引文献8

相关作者

相关机构

相关主题

浏览历史