唇读中的HLM模型及其文字流解析被引量：1

Lipreading HLM and Text Flow Analysis

下载PDF

导出

摘要由于唇动序列和语言序列是一对多的映射,计算机自动唇读识别仅使用HMM是远远不够的。以HMM为基础,结合语言先验知识,建立了新的唇动识别模型——HLM(HMM and Bigram Language Model)。HLM突破了单纯采用HMM计算声学后验概率进行识别的传统框架,将HMM和语言背景知识紧密联系起来,依据语言模型对语言背景知识进行统计,在识别阶段融合声学后验概率和语言学先验概率进行判决。实验结果表明,HLM可使单音识别率提高7.3%,句子识别率提高19.5%。另外,采用语言模型对文字流进行解析,而不再是盲目文字匹配,单一视觉流的解析精确率达70.5%。 Since lip movement sequence and language sequence are one-to-many mapping, it is far from sufficiency to use only HMM for lip-reading recognition. Proposed a novel recognition model HLM（ HMM and Bigram Language Model）, which is based on HMM, and combined with prior knowledge of language. In contrary to the traditional framework, which adopts pure acoustic HMM posterior probability calculation for recognition, HLM combines closely language background knowledge and HMM. It carries on background knowledge of the language statistics according to language model. Acoustic posterior probability and linguistics prior probability are fused for judgments in the recognition stage. Experimental results demonstrated that applying HLM, syllable accuracy can increase by 7. 3%, and sentence accuracy can increas by 19. 5%. In addition, exploited language model for text flow analysis, rather than blindly text matching. In single video channel the accuracy can be up to 70. 5 %.

作者王丹姚鸿勋万玉奇洪晓鹏

机构地区哈尔滨工业大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2008年第12期171-174,共4页 Computer Science

基金黑龙江省自然科学基金项目(E2005-29) 哈尔滨工业大学"新世纪人才支持计划"(NCET-05-0334)

关键词唇读识别模型 HLM HMM Lipreading, Recognition model, HLM, HMM

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] O174.5 [理学—基础数学]

引文网络
相关文献

参考文献13

1Potamianos G, et al. Audio - Visual Automatic Speech Reeognition: An Overview [M]. MIT Press, 2004
2Potamianos G,Graf H P, Cosatto E. An Image Transform Approach for HMM Based Automatic Lipreading[C]//Proc. Int. Conf. Image Processing. 1998,1:173-177
3Potamianos G, Neti C. Improved ROI and Within Frame Discriminant Features for Lipreading[C]//Proc. Int. Conf. Image Processing. Thessaloniki, Greece, 2001,3 : 250-253
4姚鸿勋,高文,王瑞,郎咸波.视觉语言——唇读综述[J].电子学报,2001,29(2):239-246. 被引量：30
5Potamianos G, et al. Recent Advances in the Automatic Recognition of Audio-visual Speech[C]. Proc. of the IEEE, 200a, 91 (9) : 1306-1326
6Rosenfeld R. A Maximum Entropy to Adaptive Statistical Language Learning[C]. Computer Speech and Language, 1996, 10 (3) : 187-228
7Chomsky N. Aspects of the Theory of Syntax [M]. Cambridge: MIT Press, 1965
8Chomsky N. Syntactic structures[M]. Mouton, 1964
9黄昌宁,张小凤.自然语言处理技术的三个里程碑[J].外语教学与研究,2002,34(3):180-187. 被引量：20
10Hong Xiaopeng, Yao Hongxun, Wan Yuqi, et al. A PCA Based Visual DCT Feature Extraction Method for Lip-reading[C]//Int. Conf. on Intelligent Information Hiding and Multimedia Signal Processing. 2006

二级参考文献14

1董振东.汉语分词研究漫谈[J].语言文字应用,1997(1):109-114. 被引量：11
2王瑞.连续语音唇读识别的研究.哈尔滨工业大学计算机系博士论文开题报告[M].哈尔滨工业大学档案馆,1998..
3徐彦君.中文双语料语音识别关键技术研究：博士论文[M].北京:中科院语音所,1998..
4间濑健二.读唇[J].电子情报通信学会论文志,1990,73(6):796-803.
5Yao H，IEEE Fourth Int Conference on Signal Processing，1998年，912页
6徐彦君，博士学位论文，1998年
7王瑞，博士论文开题报告，1998年
8Liu M B，计算机学报，1998年，21卷，6期，527页
9Li N，http://www.cs.ucf.edu/～vision/papers/shah/97/NDS97 pdf，1997年
10Chiou G I，IEEE Trans Image Processing，1997年，6卷，8期，1192页

共引文献48

1孔晓风,李莹,李昊旻,吕旭东.基于自然语言处理技术的消化科内窥镜检查报告的结构化[J].中国医疗器械杂志,2008,32(5):348-351. 被引量：6
2荣传振,岳振军,贾永兴,王渊,杨宇.唇语识别关键技术研究进展[J].数据采集与处理,2012,27(S2):277-283. 被引量：4
3李良炎,何中市,易勇.基于词联接的语义分析原理及其算法[J].重庆大学学报（自然科学版）,2004,27(8):69-74. 被引量：2
4王志良,解仑,董平.情感计算数学模型的研究初探[J].计算机工程,2004,30(21):33-34. 被引量：7
5曹雁锋,万建成,卢雷.基于二元运算关系的汉语计算语法模型[J].山东大学学报（工学版）,2005,35(1):88-93. 被引量：2
6洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
7雷江华.看话训练在我国口语教学中的地位与作用[J].中国特殊教育,2005(4):36-41. 被引量：6
8鹿佳,姚鸿勋.改进AdaBoost对基于HMM的唇读系统识别率的提高[J].哈尔滨商业大学学报（自然科学版）,2005,21(5):604-607.
9郭慧志.汉语自动分析问题[J].中国科技翻译,2005,18(4):18-21.
10刘庆辉,姚鸿勋.基于唇动的说话人识别技术[J].计算机工程与应用,2006,42(12):85-88.

同被引文献8

1Jong-Seok Lee. Visual-speech-pass filtering for robust au- tomatic lip-reading [J]. Pattern Analysis and Applica- tions, 2014, 17(3) :611-621.
2Sunil S. Morade, Suprava Patnaik. A novel lip reading algorithm by using localized ACM and HMM: Tested for digit recognition[J]. Optik-International Journal for Lightand Electron Optics, 2014, 125(18) :5181-5186.
3Chuanzhen Rong, Zhenjun Yue. A Novel Feature Selec- tion and Extraction Method for Sequence Images of Lip- reading[ C ] //Advances in Automation and Robotics. 2011:347-353.
4肖航.语料库在线[EB/OL].http://www.cncorpus.org/CCindex.aspx,2015.
5Benjamin Pieart, Thomas Drugman, Thierry Dutoit. Anal- ysis and HMM-based synthesis of hypo and hyperarticulat- ed speech[J]. Computer Speech & Language, 2014, 28 (2) :687-707.
6Yuan Ge, Qigong Chen, Ming Jiang, et al. SCHMM- based modeling and prediction of random delays in net- worked control systems[J]. Journal of Franklin Institute, 2014, 351 (5) :2430-2453.
7孙晓鹏,安丹丹,刘小丹.拼音文本驱动的任意嘴唇曲线的动画生成[J].计算机辅助设计与图形学学报,2008,20(12):1603-1608. 被引量：2
8李皓,陈艳艳,唐朝京.唇部子运动与权重函数表征的汉语动态视位[J].信号处理,2012,28(3):322-328. 被引量：12

引证文献1

1荣传振,岳振军,王渊,杨宇.模糊语言模型在唇读系统中的应用[J].信号处理,2015,31(10):1301-1306. 被引量：1

二级引证文献1

1李华,屈丹,张文林,王炳锡,梁玉龙.结合全局词向量特征的循环神经网络语言模型[J].信号处理,2016,32(6):715-723. 被引量：10

1陈兆乾,周志华,李红兵,谢俊元.混合型学习模型HLM中的增量学习算法[J].软件学报,1997,8(11):875-880. 被引量：5
2快7倍的迅雷软件[J].科技展望（幻想大王）,2005(03S):17-17.
3荣传振,岳振军,王渊,杨宇.模糊语言模型在唇读系统中的应用[J].信号处理,2015,31(10):1301-1306. 被引量：1
4田孝贵,杨存洁.关于高等代数的教材改革[J].数学教育学报,1999,8(1):87-89. 被引量：6
5李存,张凌浩.视觉流和操作流理论在移动设备界面中的交互设计研究[J].决策与信息,2014(21):122-122.
6王笑旻.基于Bigram的特征词抽取及自动分类方法研究[J].计算机工程与应用,2005,41(22):177-179. 被引量：5
7龚千军.基于网络爬虫的多媒体课件下载系统设计与实现[J].电脑编程技巧与维护,2016(9):70-71.
8稽毒大比武[J].电脑应用文萃,2006(4):11-11.
9黄小锋,张晶.微服务框架介绍与实现[J].电脑与信息技术,2016,24(6):14-16. 被引量：25
10陈兆乾,孙荣建.一种混合型机器学习模型[J].软件学报,1997,8(A00):312-319. 被引量：1

计算机科学

2008年第12期

浏览历史

内容加载中请稍等...

唇读中的HLM模型及其文字流解析被引量：1

参考文献13

二级参考文献14

共引文献48

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

唇读中的HLM模型及其文字流解析 被引量：1

参考文献13

二级参考文献14

共引文献48

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

唇读中的HLM模型及其文字流解析被引量：1