期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于关键视图的文本驱动3D场景编辑方法
1
作者 张冀 崔文帅 +2 位作者 张荣华 王文彬 李亚琦 《图学学报》 CSCD 北大核心 2024年第4期834-844,共11页
基于去噪扩散模型的零样本图像编辑方法取得了瞩目的成就,将之应用于3D场景编辑可实现零样本的文本驱动3D场景编辑。然而,其3D编辑效果容易受扩散模型的3D连续性与过度编辑等问题影响,产生错误的编辑结果。针对这些问题,提出了一种新的... 基于去噪扩散模型的零样本图像编辑方法取得了瞩目的成就,将之应用于3D场景编辑可实现零样本的文本驱动3D场景编辑。然而,其3D编辑效果容易受扩散模型的3D连续性与过度编辑等问题影响,产生错误的编辑结果。针对这些问题,提出了一种新的文本驱动3D编辑方法,该方法从数据端着手,提出了基于关键视图的数据迭代方法与基于像素点的异常数据掩码模块。关键视图数据可以引导一个3D区域的编辑以减少3D不一致数据的影响,而数据掩码模块则可以过滤掉2D输入数据中的异常点。使用该方法,可以实现生动的照片级文本驱动3D场景编辑效果。实验证明,相较于一些目前先进的文本驱动3D场景编辑方法,可以大大减少3D场景中错误的编辑,实现更加生动的、更具真实感的3D编辑效果。此外,使用该方法生成的编辑结果更具多样性、编辑效率也更高。 展开更多
关键词 扩散模型 文本驱动 3D场景编辑 关键视图 数据掩码
下载PDF
文本驱动的情绪多样化人脸动画生成研究
2
作者 刘增科 殷继彬 《计算机科学》 CSCD 北大核心 2024年第S02期313-320,共8页
文中介绍了一种新型的文本驱动人脸动画合成技术,该技术通过融合情绪模型以增强面部表情的表现力。这一技术主要由两个核心部分构成:面部情感模拟和唇形与语音的一致性。首先,通过对输入文本的深度分析,识别出其中包含的情感类型及其强... 文中介绍了一种新型的文本驱动人脸动画合成技术,该技术通过融合情绪模型以增强面部表情的表现力。这一技术主要由两个核心部分构成:面部情感模拟和唇形与语音的一致性。首先,通过对输入文本的深度分析,识别出其中包含的情感类型及其强度。然后,基于这些情感信息,应用三维自由变形算法(DFFD)来生成相应的面部表情。与此同时,收集人类发音时的语音音素和唇形数据,并利用强制对齐技术,将这些数据与文本中的语音音素在时间上进行精确匹配,从而产生一系列唇部关键点的变化。随后,通过线性插值方法生成中间帧,以进一步细化唇部运动的时间序列。最后,使用DFFD算法根据这些时间序列数据合成相应的唇形动画。通过对面部情感和唇形动画进行细致的权重配比,成功实现了高度逼真的虚拟人脸表情动画。该研究不仅解决了文本驱动面部表情合成中的信息缺失问题,而且克服了表情单一和面部表情与唇形不协调的挑战,为人机交互、游戏开发、影视制作等领域提供了一种创新的应用方案。 展开更多
关键词 文本驱动动画 情绪模型 DFFD 面部动画合成 情绪强度 唇形语音一致性
下载PDF
文本驱动的聋哑人手语合成系统 被引量:7
3
作者 宋益波 高文 +4 位作者 尹宝才 刘颖 晏洁 徐琳 陈海涛 《计算机学报》 EI CSCD 北大核心 1999年第7期733-739,共7页
主要介绍作者在文本驱动的聋哑人手语合成研究领域取得的研究成果.给出了手语、手势的形式化定义;介绍了设计、实现的文本驱动的聋哑人手语合成系统的结构和手语合成过程;提出了虚拟三维人手及手臂的抽象结构、手及手臂的运动控制模... 主要介绍作者在文本驱动的聋哑人手语合成研究领域取得的研究成果.给出了手语、手势的形式化定义;介绍了设计、实现的文本驱动的聋哑人手语合成系统的结构和手语合成过程;提出了虚拟三维人手及手臂的抽象结构、手及手臂的运动控制模型、手语参数的获取方法、手势库的建立方法以及手及手臂的运动单元运动控制算法;给出了详细的实验结果及结论. 展开更多
关键词 手语合成系统 文本驱动 聋哑人 自然语言处理
下载PDF
文本驱动的唇动合成系统 被引量:16
4
作者 晏洁 《计算机工程与设计》 CSCD 北大核心 1998年第1期31-34,共4页
国内在汉语拼音到口型的变换方面还没有相应的研究。本文根据汉语拼音的构成及发音时唇动变动特点,首先定义了一个基本口型集,其中包括6种基本口型,再根据该基本口型集,衍生出一个韵母口型库,使每一个汉字在发音时都对应着相应的... 国内在汉语拼音到口型的变换方面还没有相应的研究。本文根据汉语拼音的构成及发音时唇动变动特点,首先定义了一个基本口型集,其中包括6种基本口型,再根据该基本口型集,衍生出一个韵母口型库,使每一个汉字在发音时都对应着相应的口型。文本驱动的唇动合成系统的功能为对于任意输入文本,系统均可将该输入文本切分为单独的汉字并对应到三维虚拟人脸的唇动变化中去。本系统的实现在聋哑人辅助教学,提高聋哑人与正常人之间日常交流方面进行了有益的尝试。 展开更多
关键词 语音学 文本驱动 唇动合成系统 CAI
下载PDF
文本驱动的面部表情合成系统的设计与实现
5
作者 晏洁 宋益波 高文 《计算机工程与科学》 CSCD 1997年第4期14-18,23,共6页
本文设计并实现了文本驱动的面部表情合成系统。本系统可以应用于聋哑人辅助教学。
关键词 文本驱动 面部表情合成 图形处理 CAI
下载PDF
文本驱动下的表情合成系统 被引量:2
6
作者 赵震 王普 卢增祥 《计算机工程》 CAS CSCD 北大核心 2003年第9期152-154,共3页
阐述了一种通过文本来实时驱动表情合成的系统的工作原理:在给表情进行基本分类后,将这些分类与具有感情色彩的词形成对应关系。然后在对句子的切词过程中找到这些词,并判断它们在句子中的性质,由一定的修饰关系和主谓关系讨论它们... 阐述了一种通过文本来实时驱动表情合成的系统的工作原理:在给表情进行基本分类后,将这些分类与具有感情色彩的词形成对应关系。然后在对句子的切词过程中找到这些词,并判断它们在句子中的性质,由一定的修饰关系和主谓关系讨论它们对虚拟人物的表情的影响。最后利用表情与肌肉运动的对应关系,驱动虚拟人物面部表情,呈现给使用者。该文希望通过对文本驱动表情技术的研究,完善交互系统和虚拟系统,解决虚拟人物表情实时合成问题,并降低虚拟人物的制作费用,提高制作效率。 展开更多
关键词 表情合成 文本驱动 表情顺延 虚拟人物 情绪提取
下载PDF
基于汉语文本驱动的人脸语音同步动画系统 被引量:2
7
作者 杜鹏 房宁 赵群飞 《计算机工程》 CAS CSCD 2012年第13期260-262,265,共4页
为解决动画流与语音流的同步问题,设计并实现一种人脸语音同步动画系统。将所有中文音素分为16组中文可视音素,并用输入的人脸图像合成对应的关键帧,分析输入文本得到中文可视音素序列和动画的关键帧序列,将该关键帧序列与语音流对齐,... 为解决动画流与语音流的同步问题,设计并实现一种人脸语音同步动画系统。将所有中文音素分为16组中文可视音素,并用输入的人脸图像合成对应的关键帧,分析输入文本得到中文可视音素序列和动画的关键帧序列,将该关键帧序列与语音流对齐,在关键帧之间插入过渡帧的同时,播放语音流和动画流,以实现人脸语音同步动画。实验结果表明,该系统能产生符合人们视觉和听觉感受的人脸语音同步动画。 展开更多
关键词 人脸动画 语音同步 中文可视音素 关键帧 过渡帧 文本驱动
下载PDF
基于深度条件扩散模型的零样本文本驱动虚拟人生成方法 被引量:2
8
作者 王吉 王森 +2 位作者 蒋智文 谢志峰 李梦甜 《图学学报》 CSCD 北大核心 2023年第6期1218-1226,共9页
虚拟人生成技术对于虚拟现实和影视制作等领域有重要意义。针对现有虚拟人生成需要大量数据和制作成本等问题,提出一种基于扩散模型的零样本文本驱动的三维虚拟人生成方法,包括条件人体生成和迭代纹理细化2个阶段。第一阶段,首先利用神... 虚拟人生成技术对于虚拟现实和影视制作等领域有重要意义。针对现有虚拟人生成需要大量数据和制作成本等问题,提出一种基于扩散模型的零样本文本驱动的三维虚拟人生成方法,包括条件人体生成和迭代纹理细化2个阶段。第一阶段,首先利用神经网络初始化三维人体的隐式表示,然后,使用一个基于文本提示的深度条件扩散模型来引导神经隐式场生成用户所需的虚拟人模型。第二阶段,利用扩散模型进行去噪还原,针对第一阶段人体模型提供的纹理先验进行高精度的纹理图推理更新,进而迭代细化虚拟人的纹理表示,生成最终结果。使用该方法,用户可以创建一个生动的具有任意文本描述的虚拟人,而无需使用任何参考照片。实验结果表明,该方法可以在给定的文本提示条件下生成具有真实感的高质量、生动的虚拟人。 展开更多
关键词 扩散模型 虚拟人 零样本 文本驱动的生成 深度学习
下载PDF
基于文本驱动的动画素材自动检索系统设计 被引量:3
9
作者 王永强 韩磊 《现代电子技术》 北大核心 2018年第24期167-169,共3页
针对当前方法在设计动画素材自动检索系统时,当用户输入样图文件较大,不适于存储的情况下,多是经过JPEG压缩,导致图像产生很多噪点,严重影响后续检索结果,为此提出基于文本驱动的动画素材自动检索系统设计方法。对动画素材自动检索系统... 针对当前方法在设计动画素材自动检索系统时,当用户输入样图文件较大,不适于存储的情况下,多是经过JPEG压缩,导致图像产生很多噪点,严重影响后续检索结果,为此提出基于文本驱动的动画素材自动检索系统设计方法。对动画素材自动检索系统的功能单元进行具体分析;同时以动画素材样图分割、图像特征提取以及图像特征检索技术为基础,设计动画素材自动检索系统的文本驱动,设计系统服务器数据库动画素材数据录入准则和检验方法,增强系统规范化和扩展性。通过实验结果分析可知,所提方法获得的检索图像质量较好,保留了图像的细节特征,且获得的检索结果与用户输入的动画素材样图相似度较高,能够满足系统设计要求。 展开更多
关键词 文本驱动 动画素材 自动检索 特征提取 图像质量 系统设计
下载PDF
基于文本驱动的人脸表情动画系统
10
作者 林凡 《计算机光盘软件与应用》 2012年第15期191-192,共2页
人脸表情动画是计算机图形学的重要研究领域之一,在影视和游戏中的虚拟人的应用促进了它的发展,它主要研究若干种典型表情的产生以及利用已有表情产生中间过渡表情。本文主要介绍了表情动画的研究现状,并且设计实现了基于文本驱动的人... 人脸表情动画是计算机图形学的重要研究领域之一,在影视和游戏中的虚拟人的应用促进了它的发展,它主要研究若干种典型表情的产生以及利用已有表情产生中间过渡表情。本文主要介绍了表情动画的研究现状,并且设计实现了基于文本驱动的人脸表情变化系统。 展开更多
关键词 表情 文本驱动 人脸动画
下载PDF
文本引导视频预测大模型的场景动态控制综述
11
作者 吴福祥 程俊 《集成技术》 2025年第1期9-24,共16页
近年来,生成式人工智能的快速发展使文本驱动的视频预测大模型成为学术界和工业界的研究热点。视频预测生成需处理时间维度的动态性和一致性,要求精准控制场景结构、主体行为、相机运动和语义表达。当前的主要挑战是如何精确控制视频预... 近年来,生成式人工智能的快速发展使文本驱动的视频预测大模型成为学术界和工业界的研究热点。视频预测生成需处理时间维度的动态性和一致性,要求精准控制场景结构、主体行为、相机运动和语义表达。当前的主要挑战是如何精确控制视频预测中的场景动态,以实现高质量和语义一致的输出。针对此问题,一些研究者提出了相机控制增强、参考视频控制、语义一致性增强和主体特征控制增强等方法,旨在提升视频预测的生成质量,确保生成内容既符合历史条件,又满足用户需求。该文系统探讨了上述4个控制方法的核心思想、优缺点和未来发展方向。 展开更多
关键词 文本驱动视频预测 动态控制 相机控制 语义增强 主体特征控制
下载PDF
改进Wav2Lip的文本音频驱动人脸动画生成
12
作者 孙瑜 朱欣娟 《计算机系统应用》 2024年第2期276-283,共8页
为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2... 为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2Lip模型中,引入文本特征,提升唇音时间同步性从而提高人脸动画视频的真实性.本文模型综合提取到的文本信息、音频信息和说话人面部信息,在预训练的唇部判别器和视频质量判别器的监督下,生成高真实感的唇音同步人脸动画视频.与ATVGnet模型和Wav2Lip模型的对比实验表明,本文模型生成的唇音同步人脸动画视频提升了唇形和音频之间的同步性,提高了人脸动画视频整体的真实感.本文成果为当前人脸动画生成需求提供一种解决方案. 展开更多
关键词 文本音频驱动 人脸动画 Wav2Lip模型 动画生成
下载PDF
基于扩散模型的文本生成材质贴图的泛化性优化方法
13
作者 涂晴昊 李元琪 +2 位作者 刘一凡 过洁 郭延文 《图学学报》 2025年第1期139-149,共11页
针对现有的材质贴图数据集存在着文字描述不足且纯图像数据集规模庞大的现状,及传统的生成模型推理错误时难以获得额外的超参数来生成新的结果等问题,提出一种基于稳定扩散模型的文本生成材质贴图的泛化性优化方法,采用分阶段的方式训... 针对现有的材质贴图数据集存在着文字描述不足且纯图像数据集规模庞大的现状,及传统的生成模型推理错误时难以获得额外的超参数来生成新的结果等问题,提出一种基于稳定扩散模型的文本生成材质贴图的泛化性优化方法,采用分阶段的方式训练模型:使用大规模纯图像数据集对扩散模型进行微调,以拟合图像的生成;使用小规模含文本标注的数据集学习语义信息;引入新的解码器对扩散模型生成的隐编码重建得到材质贴图;最终可以通过输入文本描述获得多组随机生成的且符合描述的材质贴图结果。该方法使用Colossal架构组织代码,大大降低了训练的硬件要求;将图像拟合数据集、语义信息学习的工作分开,使用大规模图像数据集拟合模型参数,使用小规模文本数据学习语义信息,提高了模型的泛化性,减少了对多模态数据集规模的需求。 展开更多
关键词 扩散模型 泛化性 多模态 文本驱动材质贴图生成 材质编辑器
下载PDF
日语微机软件常用术语(九)
14
作者 谷玲怡 《东北亚外语研究》 1996年第7期8-10,共3页
日语微机软件常用术语(九)哈尔滨理工大学谷玲怡/非压缩。/左画面。/左单击。/左裁齐。/左空白。/左端。/左对齐。/巨大,重要。/日期。/故障。/打击,适合。/二进制。/画图方法。/表计算。/创建表。/显示。/仅显示... 日语微机软件常用术语(九)哈尔滨理工大学谷玲怡/非压缩。/左画面。/左单击。/左裁齐。/左空白。/左端。/左对齐。/巨大,重要。/日期。/故障。/打击,适合。/二进制。/画图方法。/表计算。/创建表。/显示。/仅显示。/指定显示倍率。/标准。/标准值... 展开更多
关键词 常用术语 微机软件 日语 标准字符 文本驱动 下拉式菜单 通信协议 汉字标注 格式误差 字体列表
下载PDF
HAS Dynamic Buffer-Driven Resource Management to Enhance QoE in Mobile Network 被引量:2
15
作者 Fei Wang Zesong Fei Jing Wang 《China Communications》 SCIE CSCD 2017年第7期11-24,共14页
Hypertext transfer protocol(HTTP) adaptive streaming(HAS) plays a key role in mobile video transmission. Considering the multi-segment and multi-rate features of HAS, this paper proposes a buffer-driven resource manag... Hypertext transfer protocol(HTTP) adaptive streaming(HAS) plays a key role in mobile video transmission. Considering the multi-segment and multi-rate features of HAS, this paper proposes a buffer-driven resource management(BDRM) method to enhance HAS quality of experience(QoE) in mobile network. Different from the traditional methods only focusing on base station side without considering the buffer, the proposed method takes both station and client sides into account and end user's buffer plays as the drive of whole schedule process. The proposed HAS QoE influencing factors are composed of initial delay, rebuffering and quality level. The BDRM method decomposes the HAS QoE maximization problem into client and base station sides separately to solve it in multicell and multi-user video playing scene in mobile network. In client side, the decision is made based on buffer probe and rate request algorithm by each user separately. It guarantees the less rebuffering events and decides which HAS segment rate to fetch. While, in the base station side, the schedule of wireless resource is made to maximize the quality level of all access clients and decides the final rate pulled from HAS server. The drive of buffer and twice rate request schemes make BDRMtake full advantage of HAS's multi-segment and multi-rate features. As to the simulation results, compared with proportional fair(PF), Max C/I and traditional HAS schedule(THS) methods, the proposed BDRM method decreases rebuffering percent to 1.96% from 11.1% with PF and from 7.01% with THS and increases the mean MOS of all users to 3.94 from 3.42 with PF method and from 2.15 with Max C/I method. It also guarantees a high fairness with 0.98 from the view of objective and subjective assessment metrics. 展开更多
关键词 resource management Hypertexl transfer protocol (HTTP) adaptive streaming (HAS) BUFFER rate request quality of experience (QoE) mobile network
下载PDF
利用图式提高学生的阅读技能 被引量:2
16
作者 马智慧 《中小学外语教学》 北大核心 2009年第3期21-25,共5页
本文介绍了阅读理解的三种模式,揭示了图式知识对阅读理解的重要性,阐述了帮助学生建立并扩展图式的几种教学方法及其适合的教学情景,论证了利用图式驱动阅读教学有助于提高学生的阅读技能。
关键词 阅读模式 图式 文本驱动阅读模式 图式驱动阅读模式 交互阅读模式
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部