-
题名汉语三维发音动作合成和动态模拟
被引量:1
- 1
-
-
作者
郑红娜
朱云
王岚
陈辉
-
机构
中国科学院深圳先进技术研究院集成所环绕智能实验室
太原理工大学信息工程学院
中国科学院软件研究所
-
出处
《集成技术》
2013年第1期23-28,共6页
-
基金
国家自然科学基金项目(NSFC61135003
NSFC90920002)
中国科学院知识创新工程项目(KJCXZ-YW-617)
-
文摘
本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。
-
关键词
聋儿易错发音文本
3d说话人头
CM协同发音模型
电磁发音动作采集仪(EMA)
dIRICHLET
Free-Form
deformation
(dFFd)算法
-
Keywords
hearing loss children’s fallible pronunciation texts
3d talking head
CM co-articulation model
electromagnetic articulography (EMA)
dirichlet Free-Form deformation (dFFd) algorithm
-
分类号
TN912.3
[电子电信—通信与信息系统]
-