-
题名利用SAPI5完成中文语音音素的分解
被引量:16
- 1
-
-
作者
宋阳
刘胜兰
张燕宏
-
机构
合肥华腾科技有限公司中心研发部
[
-
出处
《微计算机信息》
北大核心
2005年第3期230-231,27,共3页
-
文摘
本文讲述了在基于网络的人-人交互系统中,如何利用SAPI5来进行中文语音音素的分解,介绍了SAPI5语音识别(SR)引擎所提供的服务,在一个已经实现的MPEG-4兼容的人脸动画系统基础上,阐述了其在网络人-人交互系统应用中的设计思路和具体相关实现技术。
-
关键词
SAPI5.0
MPEG-4
语音识别
音素
可视音素
人脸动画
-
Keywords
SAPI5.0 MPEG-4
Speech Recognition
Phoneme
Viseme
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名一个MPEG-4兼容的语音动画系统
被引量:4
- 2
-
-
作者
王洵
张道义
董兰芳
陈国良
-
机构
中国科学技术大学计算机科学技术系
国家高性能计算中心
-
出处
《系统仿真学报》
CAS
CSCD
2002年第7期925-927,944,共4页
-
基金
中国科学技术大学青年科学基金资助
-
文摘
在已经实现的一个MPEG-4兼容的人脸动画系统的基础上,设计并实现了一个MPEG-4兼容的语音动画系统。MEPG-4是国际上第一个人脸动画标准,本文首先介绍了该标准的定义和我们实现的与MPEG-4标准兼容的人脸语音动画的系统结构,并在此基础上,详细介绍了该系统实现过程中的关键技术,包括人脸动画、中文可视音素的定义、可视音素过渡、表情过渡、可视音素与表情混合、语音与动画同步等。我们的语音动画系统具有计算方法简单,系统通信开销小的特点,在普通微机上就能够产生带有表情的高质量的语音动画。
-
关键词
MPEG-4
兼容
语音动画系统
可视音素
HERMITE插值
语音合成系统
人脸动画系统
-
Keywords
MPEG-4
speech animation
visual text-to-speech
viseme
Hermite interpolation
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TN912.33
[电子电信—通信与信息系统]
-
-
题名汉语复韵母的三维动态视位模型
被引量:3
- 3
-
-
作者
张小凤
杨卫英
蔡方方
田超
-
机构
上海大学影视艺术技术学院
-
出处
《电声技术》
2009年第12期54-57,共4页
-
文摘
根据汉语拼音的构成及发音时的唇动特点,对汉语复韵母进行了分类,提出了一套适合各类汉语复韵母发音特点的动态视位模型,再利用Directx9.0进行图形的变换及渲染,使三维人脸口形的变换过程更加丰富自然,较传统的二维人脸动画更加灵活、生动,可广泛应用于三维游戏中角色语音动画的制作、虚拟主持人配音等方面。
-
关键词
三维人脸
口形变换
视位
可视音素
-
Keywords
3-D talking heads
lip motion
viseme
Chinese phoneme
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于汉语文本驱动的人脸语音同步动画系统
被引量:2
- 4
-
-
作者
杜鹏
房宁
赵群飞
-
机构
上海交通大学自动化系系统控制与信息处理教育部重点实验室
上海交通大学国际教育学院
-
出处
《计算机工程》
CAS
CSCD
2012年第13期260-262,265,共4页
-
文摘
为解决动画流与语音流的同步问题,设计并实现一种人脸语音同步动画系统。将所有中文音素分为16组中文可视音素,并用输入的人脸图像合成对应的关键帧,分析输入文本得到中文可视音素序列和动画的关键帧序列,将该关键帧序列与语音流对齐,在关键帧之间插入过渡帧的同时,播放语音流和动画流,以实现人脸语音同步动画。实验结果表明,该系统能产生符合人们视觉和听觉感受的人脸语音同步动画。
-
关键词
人脸动画
语音同步
中文可视音素
关键帧
过渡帧
文本驱动
-
Keywords
face animation
voice synchronization
Chinese visual phoneme
key frame
transitional frame
text drive
-
分类号
N945
[自然科学总论—系统科学]
-