用于口型识别的实时唇定位方法被引量：10

Real-Time Lip Locating Method for Lip-Movement Recognition

下载PDF

导出

摘要在许多应用于有噪声环境下的语音识别系统中 ,唇读技术能有效地降低噪声的影响 ,通过视觉通道来补充仅取决于听觉通道的信息量 ,从而提高语音识别系统的识别率 .该文提出了一种有效和稳健的唇定位跟踪方法 ,以满足不用特殊标识物和规范性照明就能对信息进行有效提取的应用需求 .该方法首先用肤色模型查找脸 ;然后用迭代算法搜索脸部区域内的眼睛 ;再根据眼睛的位置来确定脸的大小和位置 ,并对脸的下半部分采用彩色坐标变换法将唇从肤色中明显地区分出来 ;最后 ,用可变模板将上下唇的内外轮廓描述出来 . For speech recognition systems under noisy environment, lip reading technique can effectively reduce the influence of noise and improve the accurate rate of speech recognition system by adding visual information to acoustic channel. In this paper, an effective and robust approach for lip and mouth locating and tracking is presented to enable the information extraction under abnormal illumination and without special marks. This approach first locates face region with skin color model, then finds the eyes from the face region with iterative algorithm, modifies the position and size of face according to the position of eyes, transforms the lower part of face by specific color coordinators to clearly distinguish lip color from skin color, and finally describes the outline of upper lip and lower lip with deformable template.

作者姚鸿勋高文李静梅吕雅娟王瑞

机构地区哈尔滨工业大学计算机科学与工程系哈尔滨工程大学计算机科学与信息系

出处《软件学报》 EI CSCD 北大核心 2000年第8期1126-1132,共7页 Journal of Software

基金国家自然科学基金! (No.6 978930 1) 国家 86 3高科技项目基金! (No.86 3- 30 6 - ZT0 3- 0 1- 2 )资助

关键词口型识别唇定位语音识别系统模式识别 Lip reading, lip movement, skin color model, optical flow, deformable template.

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1Kin Manlam，Pattern Recognition，1996年，29卷，5期，771页

同被引文献58

1梁毅雄,龚卫国,潘英俊,李伟红,刘嘉敏,张红梅.基于奇异值分解的人脸识别方法[J].光学精密工程,2004,12(5):543-549. 被引量：40
2李小红.基于积分投影的人脸图像的特征提取[J].计算机仿真,2004,21(12):189-191. 被引量：12
3洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
4张欣,杜利民,陈柯,赵向阳.汉语语音视觉合成研究数据库CVSS1.0[J].微计算机应用,2007,28(3):260-265. 被引量：3
5李刚,王蒙军,林凌.面向残疾人的汉语可视语音数据库[J].中国生物医学工程学报,2007,26(3):355-360. 被引量：3
6Stork D G, Wolff G J,Levine E P. Neural Network Lipreading System for Improved Speech Recognition. In: Proc. Intl. Joint Conf. on Neural Networks, 1992,2: 289～295
7Hennecke M E,Stork D G,Prasad K V. Visionary Speech: Looking ahead to Practical Speechreading Systems. In: David G. Stork and Marcus E. Hennecke,eds. Speechreading by Humans and Machines, Springer and Systems Sciences. 1996. 331 ～ 350
8Gao W,Liu M B. A Hierarchical Approach to Human Face Detection in Complex Background. the First International Conference on Multimodal Interface, Beijing, 1996
9N A Fox,R B Reilly.Audio-Visual Speaker Identification Based on the Use of Dynamic Audio and Visual Features[C].In:Proceedings of the 4th Int.Conf.on Audio-and Video-Based Biometric Person Authentication,AVBPA,Guildford,UK,2003:743～751
10S Lucey,T Chen.Improved audio-visual speaker recognition via the use of a hybrid combination strategy[C].In:Conf of Audio-and VideoBased Person Authentication(AVBPA),Guildford U K,2003

引证文献10

1刘庆辉,姚鸿勋.基于唇动的说话人识别技术[J].计算机工程与应用,2006,42(12):85-88.
2李刚,王蒙军,林凌.采用非对称唇形轮廓模型提高汉语唇形识别效果[J].光学精密工程,2006,14(3):473-477. 被引量：5
3张百振,阮秋琦.积分投影预定位的变形模板提取嘴巴轮廓[J].计算机工程与应用,2006,42(35):178-180. 被引量：2
4金乃高,殷福亮.一种基于粒子滤波的双模态语音提取方法[J].大连理工大学学报,2008,48(4):596-601. 被引量：1
5丁丽娟,王晓曦,杨阳蕊,于洪志.语音驱动的唇型合成系统的实现[J].长春工程学院学报（自然科学版）,2010,11(2):109-112.
6肖庆阳,张金,左闯,范娟婷,梁碧玮,邸硕临.基于语义约束的口型序列识别方法[J].计算机应用与软件,2012,29(9):226-229.
7单卫,姚鸿勋,高文.唇读中序列口型的分类[J].中文信息学报,2002,16(1):31-36. 被引量：4
8姚鸿勋,吕雅娟,高文.基于色度分析的唇动特征提取与识别[J].电子学报,2002,30(2):168-172. 被引量：9
9李响,高志娥,强彦.基于内唇轮廓标定的唇印提取算法[J].微型机与应用,2016,35(1):49-52.
10柴秀娟,姚鸿勋,高文,王瑞.唇读识别中的基本口型分类[J].计算机科学,2002,29(2):130-133. 被引量：3

二级引证文献23

1张建明,陶宏,王良民,詹永照,宋顺林.基于SVD的唇动视觉语音特征提取技术[J].江苏大学学报（自然科学版）,2004,25(5):426-429. 被引量：3
2周晔,刘万春,朱玉文.用于说话人识别的实时唇线提取方法[J].计算机工程,2006,32(5):202-204.
3周东生,张强,魏小鹏.人脸动画中语音可视化算法研究进展[J].计算机工程与应用,2007,43(9):36-39. 被引量：3
4黄玮.柱面系统无畸变指纹采集仪的光学设计[J].光学精密工程,2007,15(5):646-650. 被引量：6
5李刚,王蒙军,林凌.面向残疾人的汉语可视语音数据库[J].中国生物医学工程学报,2007,26(3):355-360. 被引量：3
6陈蓉,姚鸿勋,洪晓鹏,万玉奇.视觉单通道唇读系统的有效性[J].计算机工程与应用,2007,43(20):28-30. 被引量：2
7李刚,王蒙军,林凌.视觉驱动的语音合成系统中唇形轮廓的傅里叶描述[J].仪器仪表学报,2007,28(8):1464-1468. 被引量：1
8奉小慧.基于改进的level set嘴唇轮廓定位方法[J].计算机应用,2009,29(1):92-94. 被引量：2
9王晓钟,潘保昌,郑胜林.基于内唇特征提取的唇语识别[J].计算机与现代化,2009(2):5-7. 被引量：1
10吴涛,王蒙军,杨珉,李刚.基于数据融合的唇形特征识别[J].河北工业大学学报,2009,38(3):68-71.

1吴善培.高噪声环境下的语音识别[J].北京邮电学院学报,1992,15(3):15-19. 被引量：1
2郑青碧.基于图像的人脸检测方法综述[J].电子设计工程,2014,22(8):108-110. 被引量：10
3李新庆,柏正尧,王玲.基于肤色的人脸检测算法的研究[J].甘肃科技纵横,2009,38(5):26-27.
4毕经迎.基于改进的全局阈值的唇部提取方法[J].电脑知识与技术,2013,9(4X):2855-2856.
5胡惠英,吴善培.小波去噪在语音识别中的应用[J].北京邮电大学学报,1999,22(3):31-34. 被引量：8
6尹显东,李在铭,姚军,唐丹,邓君.基于彩色和局部特征信息的人脸检测[J].信号处理,2003,19(z1):199-202.
7崔程尧,刘宝童,孙炜.基于瞬时dq变换的电压暂降检测方法[J].中国科技信息,2016(24):29-30.
8李智勇,田贞.基于肤色模型的人脸检测研究[J].现代电子技术,2011,34(3):131-133. 被引量：6
9韦艳柳,王旭,陈斌.利用肤色信息和几何特征的人脸检测算法研究[J].无线互联科技,2016,13(21):107-110.
10夏晶.基于美尔倒谱系数及隐马尔可夫模型的说话人识别系统研究[J].黑龙江科技信息,2012(30):4-6. 被引量：1

软件学报

2000年第8期

浏览历史

内容加载中请稍等...

用于口型识别的实时唇定位方法被引量：10

参考文献1

同被引文献58

引证文献10

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

用于口型识别的实时唇定位方法 被引量：10

参考文献1

同被引文献58

引证文献10

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

用于口型识别的实时唇定位方法被引量：10