期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
HBF Talk:语音驱动的3D面部动画合成研究
1
作者 王文祥 王少波 +1 位作者 智宇 陈昂 《计算机科学与应用》 2024年第8期168-178,共11页
近年来,语音驱动的3D面部动画得到了广泛的研究,虽然先前的工作可以从语音数据中生成连贯的3D面部动画,但是由于视听数据的稀缺性,生成的3D面部动画缺乏真实感和生动性,嘴唇运动的准确性不高。为了提高嘴唇运动的准确性和生动性,本文提... 近年来,语音驱动的3D面部动画得到了广泛的研究,虽然先前的工作可以从语音数据中生成连贯的3D面部动画,但是由于视听数据的稀缺性,生成的3D面部动画缺乏真实感和生动性,嘴唇运动的准确性不高。为了提高嘴唇运动的准确性和生动性,本文提出了一种新的模型HBF Talk (端到端的神经网络模型),通过使用Hu BERT (Hidden-Unit BERT)预训练模型对语音数据进行特征提取和编码,引入Flash模块对提取到的语音特征表示进行进一步的编码,获得更为丰富的语音特征上下文表示,最后使用带偏置的跨模态Transformer解码器进行解码。本文进行了定量和定性实验,并与现有的基线模型进行比较,显示本文HBF Talk模型具有更好的性能,提高了语音驱动的嘴唇运动的准确性和生动性。In recent years, speech-driven 3D facial animation has been widely studied. Previous work on the generation of coherent 3D facial animations was reported from speech data. However, the generated 3D facial animations lacks realism and vividness due to the scarcity of audio-visual data, and the accuracy of lip movements is not sufficient. This work is performed in order to improve the accuracy and vividness of lip movement and an end-to-end neural network model, HBF Talk, is proposed. It utilizes the Hu BERT (Hidden-Unit BERT) pre-trained model for feature extraction and encoding of speech data. The Flash module is introduced to further encode the extracted speech feature representations, resulting in more enriched contextual representations of speech features. Finally, a biased cross-modal Transformer decoder is used for decoding. This paper conducts both quantitative and qualitative experiments and compares the results with existing baseline models, demonstrating the proposed HBF Talk model outperforms previous models by improving the accuracy and liveliness of speech-driven lip movements. 展开更多
关键词 Hu BERT FLASH TRANSFORMER 3d面部动画 嘴唇运动
下载PDF
由3D扫描技术衍生的计算机3D动画之Ⅱ——动画驱动技术 被引量:2
2
作者 郭宏 邵珩 +1 位作者 鲁向阳 康晓东 《影像技术》 CAS 2003年第1期45-47,共3页
3D动画序列的生成,是一项复杂的工作。本文详细介绍了动画驱动中涉及到的角色动力学模型、运动控制、运动编辑和色造型等技术。阐述了关节动画主要算法的优、缺点;运动编辑过程的重要意义,以及运动重定向、运动变形和运动变换等环节并... 3D动画序列的生成,是一项复杂的工作。本文详细介绍了动画驱动中涉及到的角色动力学模型、运动控制、运动编辑和色造型等技术。阐述了关节动画主要算法的优、缺点;运动编辑过程的重要意义,以及运动重定向、运动变形和运动变换等环节并且对现行的角色造型模型进行了比较。最后介绍了动画驱动的工具及应用的发展和现状。 展开更多
关键词 3d扫描技术 动画驱动技术 动画模型 关节动画 角色造型 运动控制 计算机3d动画技术
下载PDF
无标记点面部表情捕捉及动画在Unity3D上的实现 被引量:2
3
作者 郑立国 于宏伟 《中国高新科技》 2019年第2期82-86,共5页
文章研究了结合Dlib人脸表情特征点获取及其在Unity3D中驱动表情动画的应用,讨论了流行的人脸特征提取库提取的人脸特征点的数量、结构和分布,分析了各特征点驱动动画的影响程度的,选出对动画影响较大的部分关键点,并说明了使用关键点驱... 文章研究了结合Dlib人脸表情特征点获取及其在Unity3D中驱动表情动画的应用,讨论了流行的人脸特征提取库提取的人脸特征点的数量、结构和分布,分析了各特征点驱动动画的影响程度的,选出对动画影响较大的部分关键点,并说明了使用关键点驱动Unity3D中Blendshape模型使之产生动画的过程,同时讨论了特征点与Blendshape变形Key的映射关系,并应用在Unity3D端。 展开更多
关键词 无标记点面部表情 特征获取 动画 UNITY3d
下载PDF
Self-Diffuser:语音驱动人脸表情的技术研究
4
作者 臧梦利 王少波 +1 位作者 智宇 陈昂 《计算机科学与应用》 2024年第8期236-249,共14页
先前的语音驱动面部表情的动画研究从音频信号中产生了较为逼真和精确的嘴唇运动和面部表情。传统的方法主要集中在学习从语音到动画的确定性映射,最近的研究开始探讨语音驱动的3D人脸动画的多样性,即通过利用扩散模型的多样性能力来捕... 先前的语音驱动面部表情的动画研究从音频信号中产生了较为逼真和精确的嘴唇运动和面部表情。传统的方法主要集中在学习从语音到动画的确定性映射,最近的研究开始探讨语音驱动的3D人脸动画的多样性,即通过利用扩散模型的多样性能力来捕捉音频和面部运动之间复杂的多对多关系来完成任务。本文的Self-Diffuser方法使用预训练的大语言模型wav2vec 2.0对音频输入进行编码,通过引入基于扩散的技术,将其与Transformer相结合来完成生成任务。本研究不仅克服了传统回归模型在生成具有唇读可理解性的真实准确唇运动方面的局限性,还探讨了精确的嘴唇同步和创造与语音无关的面部表情之间的权衡。通过对比、分析当前最先进的方法,本文的Self-Diffuser方法,使得语音驱动的面部动画产生了更精确的唇运动;在与说话松散相关的上半部表情方面也产生了更贴近于真实说话表情的面部运动;同时本文模型引入的扩散机制使得生成3D人脸动画序列的多样性能力也大大提高。Previous research on speech-driven facial expression animation has achieved realistic and accurate lip movements and facial expressions from audio signals. Traditional methods primarily focused on learning deterministic mappings from speech to animation. Recent studies have started exploring the diversity of speech-driven 3D facial animation, aiming to capture the complex many-to-many relationships between audio and facial motion by leveraging the diversity capabilities of diffusion models. In this study, the Self-Diffuser method is proposed by utilizing the pre-trained large-scale language model wav2vec 2.0 to encode audio inputs. By introducing diffusion-based techniques and combining them with Transformers, the generation task is accomplished. This research not only overcomes the limitations of traditional regression models in generating lip movements that are both realistic and lip-reading comprehensible, but also explores the trade-off between precise lip synchronization and creating facial expressions independent of speech. Through comparisons and analysis with the current state-of-the-art methods, the Self-Diffuser method in this paper achieves more accurate lip movements in speech-driven facial animation. It also produces facial motions that closely resemble real speaking expressions in the upper face region correlated with speech looseness. Additionally, the introduced diffusion mechanism significantly enhances the diversity capabilities in generating 3D facial animation sequences. 展开更多
关键词 wav2vec 2.0 TRANSFORMER 扩散机制 语音驱动 面部动画
下载PDF
3D人体面部表情动画系统
5
作者 林挺 张鲁子 《现代计算机》 2006年第2期101-103,共3页
本文讨论动画系统的一个子集的发展。中间目标是产生一个系统,它基于人体面部的视频输入,能实时产生人面的3D模型动画。首要的主题是模型操作、设计和配合、声频视频操作和同步、3D模型演示和表演、图像处理和特征提取。用连续的红绿蓝... 本文讨论动画系统的一个子集的发展。中间目标是产生一个系统,它基于人体面部的视频输入,能实时产生人面的3D模型动画。首要的主题是模型操作、设计和配合、声频视频操作和同步、3D模型演示和表演、图像处理和特征提取。用连续的红绿蓝图像,在一个时间抓一帧画面,图像处理被计时。实验表明,用全面搜索定位面部特征大约需要70ms,用局部搜索定位特征大约5ms。考虑到模型显示,模型显示用OpenInventor成功完成。 展开更多
关键词 三维动画 图像处理 显示模型 动画系统 3d模型 面部表情 视频输入 特征提取
下载PDF
由3D扫描技术衍生的计算机3D动画之I——运动捕捉技术 被引量:3
6
作者 叶颖 康晓东 +1 位作者 贺光军 郭俊来 《影像技术》 CAS 2002年第4期50-52,共3页
三维扫描技术,又称三维数字化技术,能产生物体表面甚至内部各特定点的三维空间坐标和色彩参数,据以形成被扫描物体的数字模型,因此已成为制作动画图像的一项有效方法。运动捕捉技术就是这种三维数字化技术的一种基本技术,可用以设定和... 三维扫描技术,又称三维数字化技术,能产生物体表面甚至内部各特定点的三维空间坐标和色彩参数,据以形成被扫描物体的数字模型,因此已成为制作动画图像的一项有效方法。运动捕捉技术就是这种三维数字化技术的一种基本技术,可用以设定和记录动画角色的三维运动轨迹和表演,并把这些信息转化成数码数据,以此构成抽象的动画影像。本文阐述其基本原理。 展开更多
关键词 3d扫描技术 运动捕捉技术 三维动画 计算机动画技术 驱动动画技术
下载PDF
带有先验的语音驱动三维人脸动画生成方法
7
作者 吕镇宇 夏方方 +2 位作者 刘芳丽 郭润甲 郭子俊 《计算机科学与应用》 2023年第11期2072-2079,共8页
语音驱动的三维人脸生成是计算机视觉和图形学中一个非常有吸引力的研究课题。除了有趣之外,它还有广泛的应用,例如游戏动画、3D视频通话和AR/MR的3D化身。由于人脸运动的复杂性和不确定性,以往方法生成的结果有唇形不准确、面部动态性... 语音驱动的三维人脸生成是计算机视觉和图形学中一个非常有吸引力的研究课题。除了有趣之外,它还有广泛的应用,例如游戏动画、3D视频通话和AR/MR的3D化身。由于人脸运动的复杂性和不确定性,以往方法生成的结果有唇形不准确、面部动态性不佳的缺点。不同于以往一阶段的方法,我们使用一种新的两阶段的方法,在模型训练的第一阶段我们使用变分自动编码器将高维的复杂的面部映射进低维的空间,充分学习人脸运动先验。在第二阶段,Transformer根据输入的语音信号在学习到的人脸先验的基础上进行潜在代码查询,以回归的方式生成面部运动序列。这样可以降低生成面部动画的难度,减少了映射的模糊,可以在任意指定音频上得到生动的人脸说话动画,经验证我们的方法与先进的方法相比在唇形和脸部动态性上取得优势。 展开更多
关键词 语音驱动3d面部动画 3d说话人脸生成 3d动画
下载PDF
文本驱动的情绪多样化人脸动画生成研究
8
作者 刘增科 殷继彬 《计算机科学》 CSCD 北大核心 2024年第S02期313-320,共8页
文中介绍了一种新型的文本驱动人脸动画合成技术,该技术通过融合情绪模型以增强面部表情的表现力。这一技术主要由两个核心部分构成:面部情感模拟和唇形与语音的一致性。首先,通过对输入文本的深度分析,识别出其中包含的情感类型及其强... 文中介绍了一种新型的文本驱动人脸动画合成技术,该技术通过融合情绪模型以增强面部表情的表现力。这一技术主要由两个核心部分构成:面部情感模拟和唇形与语音的一致性。首先,通过对输入文本的深度分析,识别出其中包含的情感类型及其强度。然后,基于这些情感信息,应用三维自由变形算法(DFFD)来生成相应的面部表情。与此同时,收集人类发音时的语音音素和唇形数据,并利用强制对齐技术,将这些数据与文本中的语音音素在时间上进行精确匹配,从而产生一系列唇部关键点的变化。随后,通过线性插值方法生成中间帧,以进一步细化唇部运动的时间序列。最后,使用DFFD算法根据这些时间序列数据合成相应的唇形动画。通过对面部情感和唇形动画进行细致的权重配比,成功实现了高度逼真的虚拟人脸表情动画。该研究不仅解决了文本驱动面部表情合成中的信息缺失问题,而且克服了表情单一和面部表情与唇形不协调的挑战,为人机交互、游戏开发、影视制作等领域提供了一种创新的应用方案。 展开更多
关键词 文本驱动动画 情绪模型 dFFd 面部动画合成 情绪强度 唇形语音一致性
下载PDF
一种基于时序损失的语音驱动面部运动方法
9
作者 王振凯 王承伟 +1 位作者 张一帆 李昊渊 《计算机科学与应用》 2023年第12期2521-2527,共7页
语音驱动3D面部运动的研究主要聚焦于拓展多说话人的3D面部运动数据以及获取高质量音频特征上,但采集3D面部运动数据往往需要高昂的成本和繁琐的标注流程,单一说话人的少量数据样本又会导致模型因为数据的稀疏性难以获取高质量音频特征... 语音驱动3D面部运动的研究主要聚焦于拓展多说话人的3D面部运动数据以及获取高质量音频特征上,但采集3D面部运动数据往往需要高昂的成本和繁琐的标注流程,单一说话人的少量数据样本又会导致模型因为数据的稀疏性难以获取高质量音频特征。针对该问题,论文从时间序列任务中获得启发,将可微动态时间规整(Smoothed formulation of Dynamic Time Warping, Soft-DTW)应用到语音特征与面部网格(Mesh)顶点的跨模态对齐中。经过实验表明,采用Soft-DTW作为损失函数在生成面部动画的唇形吻合度方面相较于使用均方误差(Mean Squared Error, MSE)时有所提高,可以合成更高质量的面部动画。 展开更多
关键词 语音驱动 跨模态对齐 面部动画 Soft-dTW
下载PDF
快捷驱动3D角色的实时3D软件MotionBuilder
10
《中国图象图形学报(B辑)》 北大核心 2003年第4期63-63,共1页
作为市场上颇具影响力的实时3D角色动画软件开发商。Kaydara的产品包括大家熟知的Filmbox,最近,Kaydara又推出了更为强大的3D角色动画解决方案——MotionBuilder。
关键词 实时 角色动画 3d软件 驱动 解决方案 软件开发商 市场 产品 影响力
下载PDF
3D人物面部表情研究
11
作者 尾泽直志 赵占杰 《艺术与设计.数码设计》 2003年第2期108-111,共4页
关于人物表情设计对2D动画的重要性,上期我们已经充分论述了,在给人物加上动作或表情的时候,如果不理解其处于何种状况、何种感情。动画师的创作和动画本身会很容易走样。
关键词 人物表情设计 3d动画 面部表情 《最终幻想》 图象处理
下载PDF
基于Maya的骨骼驱动改进蒙皮变形技术 被引量:3
12
作者 夏兴应 薛澄岐 《CAD/CAM与制造业信息化》 2007年第2期82-84,共3页
本文针对传统的骨骼驱动蒙皮变形技术(LBS)在大转角的关节处会发生严重的“塌陷现象”,在分析了LBS的缺陷的基础上提出了辅助骨骼驱动的改进蒙皮变形技术。该技术在大变形的关节处添加辅助骨骼,通过辅助骨骼的小角度旋转来模拟单根骨骼... 本文针对传统的骨骼驱动蒙皮变形技术(LBS)在大转角的关节处会发生严重的“塌陷现象”,在分析了LBS的缺陷的基础上提出了辅助骨骼驱动的改进蒙皮变形技术。该技术在大变形的关节处添加辅助骨骼,通过辅助骨骼的小角度旋转来模拟单根骨骼的大角度旋转。 展开更多
关键词 骨骼动画 变形技术 蒙皮 MAYA 驱动 3d图形技术 运动控制 控制数据
下载PDF
3D打印下的定格动画应用研究——以面部表情和关节设计为例
13
作者 陈建强 龚廉惠 《美术文献》 2023年第2期121-123,共3页
目前,3D打印技术在动漫产业中得到多方面应用,这主要体现在定格动画制作、人物场景设计、衍生产品开发三个方面。定格动画制作周期较长,制作工艺也较为烦琐。3D打印技术使定格动画的制作材料不再局限于木偶、黏土等传统材料,制作方法上... 目前,3D打印技术在动漫产业中得到多方面应用,这主要体现在定格动画制作、人物场景设计、衍生产品开发三个方面。定格动画制作周期较长,制作工艺也较为烦琐。3D打印技术使定格动画的制作材料不再局限于木偶、黏土等传统材料,制作方法上也能利用计算机技术克服传统手工方式的一些技术瓶颈,这极大地提升了工作效率。本文主要阐述计算机和3D打印技术的发展以及这些新技术在艺术领域的应用,并通过角色的面部表情以及关节的制作与研究,具体探讨定格动画中的3D打印模型结构以及设计方法。 展开更多
关键词 3d打印 定格动画 面部表情 关节设计
原文传递
基于STC12C5A60S2单片机的光立方设计 被引量:4
14
作者 徐志颖 廖远 聂玲子 《科技广场》 2016年第7期182-184,共3页
针对传统平面显示单一的局限性,本文设计了一种基于STC12C5A60S2单片机的光立方。整个光立方以STC12C5A60S2单片机作为核心控制器,采用单色雾状方形LED组成光立方灯体,并配以NPN型三极管构成驱动电路。用户可以通过编程实现自定义3D动... 针对传统平面显示单一的局限性,本文设计了一种基于STC12C5A60S2单片机的光立方。整个光立方以STC12C5A60S2单片机作为核心控制器,采用单色雾状方形LED组成光立方灯体,并配以NPN型三极管构成驱动电路。用户可以通过编程实现自定义3D动画显示功能,该系统具有制作成本低、显示效果好、功能完善的特点。 展开更多
关键词 光立方 驱动 3d动画显示
下载PDF
Machinima的成长
15
《计算机光盘软件与应用(COMPUTER ARTS数码艺术)》 2008年第7期70-76,共7页
当Machinima在20世纪90年代第一次出现在我们的屏幕上,传统的动画家都在嘲笑它笨拙的模型,模糊的肌理以及沉闷的面部表情。但是一些新的专业工具还是将实时动画推到了一个新的发展阶段。那么现在,3D艺术家是不是应该为Machinima带来... 当Machinima在20世纪90年代第一次出现在我们的屏幕上,传统的动画家都在嘲笑它笨拙的模型,模糊的肌理以及沉闷的面部表情。但是一些新的专业工具还是将实时动画推到了一个新的发展阶段。那么现在,3D艺术家是不是应该为Machinima带来新的生命呢? 展开更多
关键词 面部表情 实时动画 艺术家 模糊 3d
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部