唇语识别关键技术研究进展被引量：4

Research Advances in Key Technology of Lip-Reading

下载PDF

导出

摘要唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统的各环节入手综述了该领域的最新研究进展,并讨论了现有方法的优缺点,最后提出了唇语识别新的应用领域和有待进一步研究的问题。唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统的各环节入手综述了该领域的最新研究进展,并讨论了现有方法的优缺点,最后提出了唇语识别新的应用领域和有待进一步研究的问题。

作者荣传振岳振军贾永兴王渊杨宇

机构地区解放军理工大学理学院

出处《数据采集与处理》 CSCD 北大核心 2012年第S2期277-283,共7页 Journal of Data Acquisition and Processing

基金解放军理工大学预研基金(20110504)资助项目

关键词唇语识别特征提取信息融合语言模型 lip reading feature extraction information fusion language model

分类号 TP274.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献37

1周书仁,邵晶,蒋加伏.基于DCT与LDA的仿生人脸识别研究[J].计算机工程与应用,2011,47(13):208-211. 被引量：6
2刘辉,杨俊安,许学忠.一种改进的隐马尔可夫模型训练方法及其在声目标识别中的应用[J].电路与系统学报,2011,16(1):58-63. 被引量：2
3梁亚玲,杜明辉.基于Lab色度空间a分量的唇部提取方法[J].计算机工程,2011,37(3):19-21. 被引量：5
4张建明,陶宏,王良民,詹永照,宋顺林.基于SVD的唇动视觉语音特征提取技术[J].江苏大学学报（自然科学版）,2004,25(5):426-429. 被引量：3
5邢永康,马少平.统计语言模型综述[J].计算机科学,2003,30(9):22-26. 被引量：37
6姚鸿勋,高文,王瑞,郎咸波.视觉语言——唇读综述[J].电子学报,2001,29(2):239-246. 被引量：31
7姚鸿勋,刘明宝,高文,范旭彤,张洪明,吕雅娟.基于彩色图像的色系坐标变换的面部定位与跟踪法[J].计算机学报,2000,23(2):158-165. 被引量：54
8Alan L. Yuille,Peter W. Hallinan,David S. Cohen.Feature extraction from faces using deformable templates[J]. International Journal of Computer Vision . 1992 (2)
9Michael Kass,Andrew Witkin,Demetri Terzopoulos.Snakes: Active contour models[J]. International Journal of Computer Vision . 1988 (4)
10Cootes TF,Edwards GJ,Taylor CJ.Active appearance models. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2001

二级参考文献70

1王守觉,曲延锋,李卫军,覃鸿.基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J].电子学报,2004,32(7):1057-1061. 被引量：46
2王瑞.连续语音唇读识别的研究.哈尔滨工业大学计算机系博士论文开题报告[M].哈尔滨工业大学档案馆,1998..
3徐彦君.中文双语料语音识别关键技术研究：博士论文[M].北京:中科院语音所,1998..
4间濑健二.读唇[J].电子情报通信学会论文志,1990,73(6):796-803.
5Potamianos G, Neti C, Iyengar G, et al. A cascade visual front end for speaker independent automatic speechreading[J]. International Journal of speech technology, 2001 (4) :193 -208.
6Gerasimos Potamianos, Chalapathy Neti. Improved ROI and within frame discriminant features for lipreading[A]. In: Proceedings of the International Conference on Image Processing[C]. Piscataway: IEEE, 2001.
7Kazuhiro Nakamura, Noriaki Murakam, Ka-zuyoshi Takagi, et al. A real-time lipreading LSI for word recognition [J/OL]. http:∥www. ap-asic. org/2002/proceedings/SC/3C _ 5. pdf, 2002.
8AWC Liew, SH Leung, WH Lau. Lip contour extraction from color images using a deformable model[J]. Pattern Recognition, 2002, 35: 2949- 2962.
9Uda K, Tagawa N, Minagawa A, et al. Effectiveness evaluation of word characteristics obtained from 3D image information for lipreading[A]. In: Proceedings 11th International Conference on Image Analysis and Processing[C]. Los Alamitos: IEEE, 2001.
10Matthews I, Potamianos G, Neti C, et al. A comparison of model and transform-based visual features for audiovisual LVCSR[A]. In: Proc lnt Conf Multimedia Expo[C]. Los Alamitos: IEEE, 2001.

共引文献128

1王思丽,祝忠明.机构知识库相关性检索机制研究与试验[J].情报科学,2020,0(2):94-101. 被引量：1
2董云耀,钱如栏.一种改进的基于隐马尔可夫的信息检索模型[J].杭州电子科技大学学报（自然科学版）,2009,29(4):46-49. 被引量：1
3曾宪贵,黎绍发,左文明.基于颜色的皮肤区域探测[J].计算机工程与应用,2004,40(17):98-99. 被引量：4
4王志良,解仑,董平.情感计算数学模型的研究初探[J].计算机工程,2004,30(21):33-34. 被引量：8
5洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
6丁海波,薛质,李生红.基于HSI空间的肤色检测方法[J].计算机应用,2004,24(B12):210-211. 被引量：20
7范晓,申铉京.基于IE浏览器的色情图片过滤器[J].吉林大学学报（信息科学版）,2004,22(6):631-637. 被引量：8
8雷江华.看话训练在我国口语教学中的地位与作用[J].中国特殊教育,2005(4):36-41. 被引量：6
9董卫军,周明全,耿国华,黎晓.基于内容的图像检索技术研究[J].计算机工程,2005,31(10):162-163. 被引量：23
10张宇.基于差分和肤色图像的人脸检测算法[J].电子科技大学学报,2005,34(4):497-500. 被引量：4

同被引文献22

1吴国斌,李斌,阎骥洲.Kinect人机交互开发实践[M].北京:人民邮电出版社,2013.
2CANDIDE - a parameterized face. http://www.icg.isy.liu.se/candide/.
3MSDN. Face Tracking Programming Guide. https://msdn.microsoft.com/en-us/library/jj130970.aspx#.
4Alper Yarg, Muzaffer Dogan. A Lip Reading Application on MS Kinect Camera. In Innovations in Intelligent Systems and Applications (INISTA), 2013 IEEE International Symposium on, pp. 1-5. IEEE, 2013.
5Rosenfeild R. Two decades of statistical language modeling: Where do we go from here? [J]. Proceedings of the IEEE, 2000, 88(8): 1270-1278.
6Sundermeyer M, Sehluter R, Ney H. On the estimation of discount parameters for language model smoothing [C]// The 12th Annual Conference of the International Speech Communication Association. Florence, Italy: ISCA, 2011:1433-1436.
7Deoras A, Mikolov T, Kombrink S, et al. Variational approximation of long-span language models for LVCSR [C]// IEEE International Conference on Acoustics, Speech and Signal Processing. Prague, Czech Republic: IEEE, 2011 : 5532-5535.
8Bengio Y, Ducharme R, Vincent P, et al. A neural probabilistic language model [J]. Journal of Machine Learning Research, 2003, 3(2): 1137-1155.
9Mikolov T, Karafiat M, Burget L, et al. Recurrent neural network based language model [C]//The llth International Speech Communication Association. Makuhari, Chiba, Japan: ISCA, 2010: 1045-1048.
10Sundermeyer M, Oparin I, Gauvain J L, et al. Comparison of feedforward and recurrent neural network language models [C]// IEEE International Conference on Acoustics, Speech and Signal Processing. Vancouver, Canada: IEEE, 2013.- 8430- 8434.

引证文献4

1刘建通.基于Kinect的听障人士语言能力康复辅助系统[J].现代计算机,2016,22(5):92-95. 被引量：1
2张剑,屈丹,李真.基于循环神经网络语言模型的N-best重打分算法[J].数据采集与处理,2016,31(2):347-354. 被引量：3
3马金林,巩元文,马自萍,陈德光,朱艳彬,刘宇灏.唇语识别的视觉特征提取方法综述[J].计算机科学与探索,2021,15(12):2256-2275. 被引量：2
4陶志勇,陈露,刘影,郭京.LipSense:基于CSI相位差的自适应唇语识别方法[J].传感技术学报,2023,36(3):419-426. 被引量：1

二级引证文献7

1王敏,曾浩.循环神经网络语言模型定点化优化算法研究[J].软件导刊,2017,16(2):63-66. 被引量：1
2刘加,张卫强.低资源语音识别若干关键技术研究进展[J].数据采集与处理,2017,32(2):205-220. 被引量：8
3李俊峰.基于循环神经网络和蝙蝠算法的变压器故障诊断[J].电工技术,2018(20):38-41. 被引量：6
4杨龙生,贾振堂.用于可靠身份认证的唇语识别[J].电视技术,2018,42(10):88-91.
5王海军,曹云,王洪磊.煤矿智能化关键技术研究与实践[J].煤田地质与勘探,2023,51(1):44-54. 被引量：27
6王腾,毕京学,陈国良,孙猛,赵美琦,曹景春,蔚保国,黄璐.信道状态信息无线感知数据获取及应用综述[J].导航定位与授时,2024,11(1):10-29. 被引量：2
7韩西,梁凯,岳宇.基于音频匹配的藏语驱动视觉语音合成算法研究[J].吉林大学学报（信息科学版）,2024,42(3):509-515.

1Read My Lips唇语识别[J].国外科技动态,2004(6):40-40.
2任玉强,田国栋,周祥东,吕江靖,周曦.高安全性人脸识别系统中的唇语识别算法研究[J].计算机应用研究,2017,34(4):1221-1225. 被引量：19
3王昌红.语音识别我也行[J].电脑知识与技术（经验技巧）,2015,0(7):33-34.
4吕品轩,王士林,李生红.基于唇语识别的特征鉴别力分析[J].信息安全与通信保密,2008,30(5):60-62. 被引量：5
5荣传振,岳振军,王渊,杨宇.模糊语言模型在唇读系统中的应用[J].信号处理,2015,31(10):1301-1306. 被引量：1
6肖庆阳,张金,左闯,范娟婷,梁碧玮,邸硕临.基于语义约束的口型序列识别方法[J].计算机应用与软件,2012,29(9):226-229.
7王渊,岳振军,贾永兴.唇语识别中的话题相关语言模型研究[J].微计算机信息,2012,28(10):115-117.
8新发现与新技术[J].电子测试,2007(4):104-104.
9王晓钟,潘保昌,郑胜林.基于内唇特征提取的唇语识别[J].计算机与现代化,2009(2):5-7. 被引量：1
10Noah Falstein,韦欢（译）.HAL和MYCROFT——两台电脑的故事[J].程序员（游戏创造）,2008(1):74-74.

数据采集与处理

2012年第S2期

浏览历史

内容加载中请稍等...

唇语识别关键技术研究进展被引量：4

参考文献37

二级参考文献70

共引文献128

同被引文献22

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

唇语识别关键技术研究进展 被引量：4

参考文献37

二级参考文献70

共引文献128

同被引文献22

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

唇语识别关键技术研究进展被引量：4