可视化协同发音合成研究综述

A Survey of the Synthesis of Visual Co-Articulation

下载PDF

导出

摘要可视语音应用于教学、通信、电子商务等领域,可进一步提高人机交互的友好性和方便性,近年来得到广泛关注。可视化协同发音合成是研究可视语音的重要环节之一,阐述可视化协同发音的基本概念,介绍有代表性的描述方法,并对基于图像和基于模型方法这两种重要的合成方法的研究现状进行评述。总结两种方法的优缺点,并展望其发展方向。 Visual speech, used in the fields of teaching, communication, e-commerce etc. to further improve the friendliness and ease of human-computer interaction, has aroused wide concern in recent years. As one of the important parts of the research on visual speech, introduces the concept of visual co-articulation as well as some representative descriptive methods and a review of the two important methods based on image and model respectively. Summarizes the advantages and disadvantages of two methods and prospects the way of its development.

作者吴翠娟赵晖

机构地区新疆大学信息科学与工程学院新疆多语种信息技术实验室

出处《现代计算机》 2014年第9期9-14,共6页 Modern Computer

基金国家自然科学基金(No.61261037)

关键词可视化协同发音唇同步语音动画 Visual Co-Articulation Lip Synchronization Speech Animation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1Ostermann J, Weissenfeld A. Talking Faces-Technologies and Applications[C]. ICPR 2004, Cambridge, United kingdom,2004. Institute of Electrical and Electronics Engineers Inc,2004:826-833.
2Mattheyses W, Latacz L, Verhelst W. Comprehensive Many-to-Many Phoneme-to-Viseme Mapping and Its Application for Concatenative Visual Speech Synthesis[J]. Speech Communication, 2013, 55(7): 857-876.
3Chen H, Wang L, Liu W, et al. Combined X-ray and Facial Videos for Phoneme-Level Articulator Dynamics[J]. The Visual Computer, 2010, 26(6-8): 477-486.
4王志明,陶建华.文本-视觉语音合成综述[J].计算机研究与发展,2006,43(1):145-152. 被引量：5
5贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：5
6Zhou Z, Zhao G, Guo Y, et al. An Image-Based Visual Speech Animation System[J]. Circuits and Systems for Video Technology, IEEE Transactions on, 2012, 22(10): 1420-1432.
7Shih P Y, Paul A, Wang J F, et al. Speech-Driven Talking Face Using Embedded Confusable System for Real Time Mobile Multimedia [J]. Multimedia Tools and Applications, 2013:1-21.
8李皓,陈艳艳,唐朝京.唇部子运动与权重函数表征的汉语动态视位[J].信号处理,2012,28(3):322-328. 被引量：12
9Jackson P L. The Theoretical Minimal Unit for Visual Speech Perception: Visemes and Coarticulation[J]. The Volta Review, 1988,90 (5):99-115.
10Auer Jr E T, Bernstein L E. Speech Reading and the Structure of the Lexicon: Computationally Modeling the Effects of Reduced Phonetic Distinctiveness on Lexical Uniqueness[J]. The Journal of the Acoustical Society of America, 1997, 102(6): 3704-3710.

二级参考文献30

1曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
2左力,李治国,李锦涛,高文.基于标注图像的MPEG-4人脸运动参数获取方法[J].系统仿真学报,2001,13(S2):497-501. 被引量：1
3徐向华,朱杰,郭强.汉语连续语音识别中的分级聚类算法的研究和应用[J].信号处理,2004,20(5):497-500. 被引量：2
4王志明,蔡莲红,艾海舟.基于数据驱动方法的汉语文本-可视语音合成(英文)[J].软件学报,2005,16(6):1054-1063. 被引量：16
5杨丹宁,郭峰,文成义.由文本至口形的媒体变换技术的研究[J].电子学报,1996,24(1):122-125. 被引量：1
6SUMMERFIELD Q. Use of visual information in phonetic perception[J]. Phonetica, 1979, 36(4-5): 314-331.
7COHEN M, MASSARO D. Modeling coarticulation in synthetic visual speech in models and techniques in computer animation[A]. Computer Animation '93[C]. Tokyo: Springer-Verlag, 1993. 139-156.
8MCGURK H, MACDONALD J. Hearing lips and seeing voices[J]. Nature, 1976, 264(5588): 746-748.
9COHEN M, MASSARO D, CLARK R. Training a talking head[Z]. ICMI'02, IEEE 4th Int Conf on Multimodal Interfaces, Pittsburgh, 2002.
10LEWIS J P, PARKE F. Automated lip-synch and speech synthesis for character animation[Z]. CHI/Gl 1987 Conference on Human Factors in Computing Systems and Graphics Interface, Toronto, Canada, 1987.

共引文献34

1吕令保,司光亚,孙林.虚拟Web信息生成系统的设计与实现[J].系统仿真学报,2009,21(S2):188-192.
2冯哲,孙吉贵,张长胜,王岩.汉语语音合成的研究进展[J].吉林大学学报（信息科学版）,2007,25(2):198-206. 被引量：7
3邵艳秋,穗志方,韩纪庆,王志伟.小规模情感数据和大规模中性数据相结合的情感韵律建模研究[J].计算机研究与发展,2007,44(9):1624-1631.
4柳春,于洪志.语音合成技术研究[J].卫生职业教育,2008,26(11):64-66. 被引量：3
5刘颖,王成儒.基于PCA和KHM聚类的唇特征提取算法的研究[J].微电子学与计算机,2008,25(8):84-87. 被引量：1
6孙晓鹏,安丹丹,刘小丹.拼音文本驱动的任意嘴唇曲线的动画生成[J].计算机辅助设计与图形学学报,2008,20(12):1603-1608. 被引量：2
7刘颖,王成儒.用于人脸动画的语音特征提取算法研究[J].电声技术,2008,32(12):49-53. 被引量：2
8吕国云,蒋冬梅,樊养余,赵荣椿,H．Sahli,W．Vlerhelst.基于多流三音素DBN模型的音视频语音识别和音素切分[J].电子与信息学报,2009,31(2):297-301.
9周维,汪增福.与语速相关的人脸语音动画合成及其评估[J].中国图象图形学报,2009,14(7):1399-1405.
10马娥娥,刘颖,王成儒.基于IOHMM的语音驱动唇动合成系统[J].计算机工程,2009,35(18):283-284. 被引量：1

1刘学杰,赵晖.改进参数控制的可视语音合成方法[J].计算机工程与设计,2017,38(4):989-995.
2牛晓松,王洵,万寿红.特征点提取及图像变形在语音动画中的应用[J].计算机工程,2005,31(9):179-181. 被引量：1
3贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：5
4王志明,蔡莲红,艾海舟.基于数据驱动方法的汉语文本-可视语音合成(英文)[J].软件学报,2005,16(6):1054-1063. 被引量：16
5万寿红,董兰芳,王洵.小波变换在人脸语音动画合成中的应用[J].计算机工程与应用,2005,41(28):49-51.
6康广玉,郭世泽,孙圣和.基于共振峰过渡的协同发音语音合成算法[J].天津大学学报,2010,43(9):810-814. 被引量：2
7王洵,张道义,董兰芳,万寿红.三维语音动画聊天室的设计与实现[J].计算机工程与应用,2004,40(1):106-108. 被引量：1
8叶静,董兰芳,王洵,万寿红.一个基于改进的HMM的人脸语音动画合成系统[J].计算机工程,2005,31(13):165-167.
9张鹏,王丽红,毛琳.语音合成系统中波形拼接过渡算法的研究[J].黑龙江大学自然科学学报,2011,28(6):867-870. 被引量：1
10王志明,陶建华.计算机应用——文本-视觉语音合成综述[J].中国学术期刊文摘,2006,12(8):5-5.

现代计算机

2014年第9期

浏览历史

内容加载中请稍等...

可视化协同发音合成研究综述

参考文献20

二级参考文献30

共引文献34

相关作者

相关机构

相关主题

浏览历史