基于HTK的语音驱动唇形动画的实现

Application of Speech Driven Lip Animation Based on HTK

下载PDF

导出

摘要语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇形序列的时间信息插值播放唇形序列,实现语音驱动的唇形动画。实验表明,该方法不仅大大减少了模型数目,而且能准确识别音节序列以及时间信息,可有效地实现语音与唇动的同步。 Lip synchronization is one of the key issues in speech driven face animation system. First se- lectes as recognition unit. Through a method based on rigorous initial and final modeling, uses HTK syllable to get syllable list and time information. Then uses the lip library and syllable-lip mapping table to obtain lip sequence corresponding with syllable sequence. Finally, speech driven face animation is achieved by interpolating and playing lip sequence with time informa- tion. Experimental results show that this method not only sharply reduces the number of models, but also recognizes and plots out the syllable and time information accurately in speech files. It effectively realizes the synchronization of speech and lip animation.

作者高春梅郑伯川

机构地区四川大学计算机学院机器智能实验室西华师范大学数学与信息学院

出处《现代计算机（中旬刊）》 2011年第11期3-7,共5页 Modern Computer

基金国家自然科学基金资助项目(60971109)

关键词语音识别语音驱动唇形动画声学模型 HTK Speech Recognition Speech Driven Lip Animation Acoustics Model HTK（Hidden Markov Models）

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1林爱华,张文俊,王毅敏,赵光俊.语音驱动人脸唇形动画的实现[J].计算机工程,2007,33(18):239-241. 被引量：1
2陈益强,高文,王兆其,姜大龙.基于机器学习的语音驱动人脸动画方法[J].软件学报,2003,14(2):215-221. 被引量：20
3孙延鹏,傅蓉,孙海伦.基于数据驱动的人脸动画合成技术的研究与发展[J].计算机工程与科学,2009,31(1):48-49. 被引量：2

二级参考文献28

1姜大龙,高文,王兆其,陈益强.面向纹理特征的真实感三维人脸动画方法[J].计算机学报,2004,27(6):750-757. 被引量：9
2徐成华,王蕴红,谭铁牛.三维人脸建模与应用[J].中国图象图形学报（A辑）,2004,9(8):893-903. 被引量：42
3周东生,张强,魏小鹏.人脸动画中语音可视化算法研究进展[J].计算机工程与应用,2007,43(9):36-39. 被引量：3
4Cootes T F, Walker K N, Taylor C J. View-Based Active Appearance Models[C] //Proc of ICFGR' 00,2000: 227-232.
5Chen Chun, Zhao Ming, Li S Z, et al. Parameter Optimization for Active Shape Models[C]//Proc of the 6th Asian Conf on Computer Vision, 2004.
6Li Ying,Lai J H,Yuen Pong C. Multi-Template ASM Method for Feature Points Detection of Facial Image with Diverse Expressions[C]//Proc of the 7th FGR Southhampton,2006.
7Choi K, Luo Y, Hwang J. Hidden Malkov Model Inversion for An-Dio-to-Visual Conversion in a MPEG-4 Facial Animation System[J]. The Journal of VLSI Signal Processing, 2001,29 (1-2) :51-61.
8Jiang D L,Gao W,Li Z G,et al. Animating Arbitrary Topology 3D Facial Model Using the MPEG-4 FaceDefTables[C] //Proc of the 4th Int'l Conf on Multi-Modal Interface,2002: 517-522.
9[1]Beskow J. Rule-Based visual speech synthesis. In: Proceedings of the 4th European Conference on Speech Communication and Technology. 1995. 299～302. http://www.speech.kth.se/～beskow/papers/es95rul.pdf.
10[2]Waters K, Levergood, TM. DECface : an automatic lip-synchronization algorithm for synthetic face. Technical Report, CRL 93-4, Digital Equipment Corporation, Cambridge Research Laboratory, 1993. ftp://crl.dec.com/pub/DEC/CRL/tech-reports/93.4.ps.Z.

共引文献20

1姜大龙,高文,王兆其,陈益强.面向纹理特征的真实感三维人脸动画方法[J].计算机学报,2004,27(6):750-757. 被引量：9
2叶静,董兰芳,王洵.用于语音动画合成的语音特征提取和聚类技术[J].微型机与应用,2004,23(8):47-49. 被引量：4
3陈皓,刘晓平.快速人脸动画方法[J].电脑应用技术,2004(60):30-34.
4叶静,董兰芳,王洵,万寿红.一个基于改进的HMM的人脸语音动画合成系统[J].计算机工程,2005,31(13):165-167.
5贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：5
6周东生,张强,魏小鹏.人脸动画中语音可视化算法研究进展[J].计算机工程与应用,2007,43(9):36-39. 被引量：3
7陈新,周东生,张强,魏小鹏.语音驱动人脸动画中语音参数的提取技术[J].计算机工程,2007,33(6):225-227.
8林鑫,陈桦,王开志,王继成.语音驱动唇形自动合成算法[J].计算机工程,2007,33(17):237-238. 被引量：6
9林爱华,张文俊,王毅敏,赵光俊.语音驱动人脸唇形动画的实现[J].计算机工程,2007,33(18):239-241. 被引量：1
10谢金晶,陈益强,刘军发.基于语音情感识别的多表情人脸动画方法[J].计算机辅助设计与图形学学报,2008,20(4):520-525. 被引量：6

1林爱华,张文俊,王毅敏,赵光俊.语音驱动人脸唇形动画的实现[J].计算机工程,2007,33(18):239-241. 被引量：1
2杨宏,钱盛友.基于图形学的唇形动画建模研究[J].电脑知识与技术,2013(1):180-182. 被引量：1
3秦添,赵晖.维吾尔语可视语音合成的唇部动画系统[J].计算机工程,2016,42(12):282-289.
4努尔艾力·喀迪尔,彭良瑞,哈力木拉提.一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法[J].计算机应用与软件,2015,32(1):171-174. 被引量：6
5王雪飞,刘珺.基于隐马可夫模型的邻近方言差异系数研究[J].计算机工程,2016,42(4):179-183.

现代计算机（中旬刊）

2011年第11期

浏览历史

内容加载中请稍等...

基于HTK的语音驱动唇形动画的实现

参考文献3

二级参考文献28

共引文献20

相关作者

相关机构

相关主题

浏览历史