期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
基于Transformer-LSTM的闽南语唇语识别
1
作者 曾蔚 罗仙仙 王鸿伟 《泉州师范学院学报》 2024年第2期10-17,共8页
针对端到端句子级闽南语唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取唇读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文... 针对端到端句子级闽南语唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取唇读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文本序列预测.最后,在自建闽南语唇语数据集上进行实验.实验结果表明:模型能有效地提高唇语识别的准确率. 展开更多
关键词 唇语识别 闽南 TRANSFORMER 长短时记忆网络(LSTM) 用时空卷积神经网络 注意力机制 端到端模型
下载PDF
Partition-Time Masking:一种唇语识别数据增强方法
2
作者 胡宇 殷继彬 《计算机科学》 CSCD 北大核心 2024年第S02期473-478,共6页
提出了一种唇语识别数据增强方法Partition-Time Masking。该方法直接作用于输入数据,通过将输入划分为多个子序列再分别进行Mask操作最后再将各子序列按序拼接,使得模型能对部分帧缺失的输入具有更强的鲁棒性,从而增强泛化能力。实验... 提出了一种唇语识别数据增强方法Partition-Time Masking。该方法直接作用于输入数据,通过将输入划分为多个子序列再分别进行Mask操作最后再将各子序列按序拼接,使得模型能对部分帧缺失的输入具有更强的鲁棒性,从而增强泛化能力。实验前根据划分的子序列数目与掩码值来源不同而设计了5种增强策略,并与唇语识别研究中最重要的数据增强方法Time Masking进行了对比实验。实验在LRW数据集和LRW1000数据集上进行,实验结果表明Partition-Time Masking方法对模型性能提升的效果要优于Time Masking方法,其中子序列数目为3、掩码值选择各子序列平均帧时为最优策略,该策略使得目前最佳的唇语识别模型DC-TCN的性能从89.6%提高到90.0%。 展开更多
关键词 唇语识别 Time Making 数据增强 视觉音识别 DC-TCN
下载PDF
解耦同类自知识蒸馏的轻量化唇语识别方法
3
作者 马金林 刘宇灏 +2 位作者 马自萍 郭兆伟 吕鑫 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第12期3709-3719,共11页
针对唇语识别模型因参数量和计算量较大而无法在移动终端和边缘设备上应用的问题,提出基于解耦同类自知识蒸馏和GhostNet-TSM的唇语识别方法。提出具有时序特征提取能力的GhostNet-TSM网络;将同类自知识蒸馏的特征解耦为目标类特征和非... 针对唇语识别模型因参数量和计算量较大而无法在移动终端和边缘设备上应用的问题,提出基于解耦同类自知识蒸馏和GhostNet-TSM的唇语识别方法。提出具有时序特征提取能力的GhostNet-TSM网络;将同类自知识蒸馏的特征解耦为目标类特征和非目标类特征,分别设置损失函数,以提高模型的识别精度;使用解耦同类自知识蒸馏方法在LRW和LIP350数据集上进行模型训练,并在OuluVS数据集上进行验证。实验结果表明:GhostNet-TSM网络在LRW数据集上达到了85.2%的识别准确率,超过了多数非轻量化模型,浮点数计算量和模型参数量降低至0.988 GFLOPs和20.310×10~6。 展开更多
关键词 唇语识别 知识蒸馏 轻量化 GhostNet TSM模块
下载PDF
基于多尺度时空卷积的唇语识别方法
4
作者 叶鸿 危劲松 +3 位作者 贾兆红 郑辉 梁栋 唐俊 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4170-4177,共8页
现有的唇语识别模型大多采用将单层的3维卷积与2维卷积神经网络结合的方式,从唇语视频序列中挖掘出时空联合特征。然而,由于单层的3维卷积不能很好地提取时间信息,同时2维卷积神经网络对细粒度的唇语特征的挖掘能力有限,该文提出一种多... 现有的唇语识别模型大多采用将单层的3维卷积与2维卷积神经网络结合的方式,从唇语视频序列中挖掘出时空联合特征。然而,由于单层的3维卷积不能很好地提取时间信息,同时2维卷积神经网络对细粒度的唇语特征的挖掘能力有限,该文提出一种多尺度唇语识别网络(MS-LipNet)以改善唇语识别任务。该文在Res2Net网络中,采用3维时空卷积替代传统的2维卷积以更好地提取时空联合特征,同时提出时空坐标注意力模块,使网络关注于任务相关的重要区域特征。在LRW和LRW-1000数据集上进行实验,验证了所提方法的有效性。 展开更多
关键词 唇语识别 多尺度时空卷积网络 Res2Net 时空坐标注意力 数据增强
下载PDF
特征注意力Transformer模块在3D唇语序列身份识别中的应用
5
作者 骈鑫洋 王瑜 张洁 《计算机工程与应用》 CSCD 北大核心 2024年第7期141-146,共6页
唇语行为是一种新兴起的生物特征识别技术,三维(three-dimensional,3D)唇语点云序列因包含真实嘴唇空间结构和运动信息,已成为个体身份识别的重要生物特征。但是,3D点云的无序与非结构化的特点导致时空特征的提取非常困难。为此,提出一... 唇语行为是一种新兴起的生物特征识别技术,三维(three-dimensional,3D)唇语点云序列因包含真实嘴唇空间结构和运动信息,已成为个体身份识别的重要生物特征。但是,3D点云的无序与非结构化的特点导致时空特征的提取非常困难。为此,提出一种深度学习网络模型,用于3D唇语序列身份识别。该网络采用四层改进的PointNet++作为网络骨干,以分层方式抽取特征,为了学习到更多包含身份信息的时空特征,设计一种动态唇特征注意力Transformer模块,连接于PointNet++网络每一层之后,可以学习到不同特征图之间的相关信息,有效捕捉视频序列不同帧的上下文信息。与其他注意力机制构建的Transformer相比,提出的Transformer模块具有较少的参数,在S3DFM-FP和S3DFM-VP数据集上进行的实验表明,提出网络模型在3D唇语点云序列的身份识别任务中效果显著,即使在不受姿态约束的S3DFM-VP数据集中也表现出良好的性能。 展开更多
关键词 说话人识别 TRANSFORMER PointNet++ 三维唇语点云
下载PDF
微运动激励与时间感知的唇语识别方法
6
作者 马金林 吕鑫 +2 位作者 马自萍 郭兆伟 吕科 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3657-3668,共12页
时序信息和唇部细微变化对唇语识别至关重要.然而,现有唇语识别方法不能精准捕获时序信息和关注细微运动.为此,提出一种关注微小唇部变化和增强时序信息的唇语识别方法DMT-GhostNet.首先,引入解藕时空增强块(Decoupled Spatio-Temporal ... 时序信息和唇部细微变化对唇语识别至关重要.然而,现有唇语识别方法不能精准捕获时序信息和关注细微运动.为此,提出一种关注微小唇部变化和增强时序信息的唇语识别方法DMT-GhostNet.首先,引入解藕时空增强块(Decoupled Spatio-Temporal Enhancement Block,DSTE),将单一3D卷积解藕为时间域和空间域;其次,基于运动激励(Motion Excitation,ME)与Ghost瓶颈块提出微运动瓶颈块(Micro-Motion Bottleneck,M-Ghost),捕捉唇部的微小运动;最后,提出时间感知模块(Transformer Multi-Scale Temporal Convolution Network,TransMS-TCN),聚焦重要时间序列,限制无关信息流入MS-TCN.实验结果表明,DMT-GhostNet在LRW数据集上取得了89.21%的准确率,比基于ResNet的主流方法提升3.91%,降低参数量近6 M,能够更好地利用时序信息并聚焦唇部细节,显著提高唇语识别性能. 展开更多
关键词 唇语识别 GhostNetV2 时间维度 微运动激励
下载PDF
基于多重视觉注意力的唇语识别
7
作者 谢胤岑 薛峰 曹明伟 《模式识别与人工智能》 EI CSCD 北大核心 2024年第1期73-84,共12页
唇语识别是将单个说话人嘴唇运动的无声视频翻译成文字的一种技术.由于嘴唇运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究唇语视觉特征的提纯问题,提出基于多重视... 唇语识别是将单个说话人嘴唇运动的无声视频翻译成文字的一种技术.由于嘴唇运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究唇语视觉特征的提纯问题,提出基于多重视觉注意力的唇语识别方法(Lipreading Based on Multiple Visual Attention Network,LipMVA).首先利用通道注意力自适应校准通道级别的特征,减轻无意义通道的干扰.然后使用两种粒度不同的时空注意力,抑制不重要的像素或帧的影响.CMLR、GRID数据集上的实验表明LipMVA可降低识别错误率,由此验证方法的有效性. 展开更多
关键词 唇语识别 视觉音识别 注意力机制 深度神经网络 特征提取
下载PDF
高安全性人脸识别系统中的唇语识别算法研究 被引量:19
8
作者 任玉强 田国栋 +2 位作者 周祥东 吕江靖 周曦 《计算机应用研究》 CSCD 北大核心 2017年第4期1221-1225,1230,共6页
针对目前人脸识别系统面临的图片和视频攻击,构建了一种将人脸识别与口令密码相结合,并采用唇语识别技术进行活体检测的高安全性身份认证系统。首先由于汉语唇语数据的缺少,建立了CNLIP1和CNLIP2两个较大的汉语唇语数据库;其次,为了保... 针对目前人脸识别系统面临的图片和视频攻击,构建了一种将人脸识别与口令密码相结合,并采用唇语识别技术进行活体检测的高安全性身份认证系统。首先由于汉语唇语数据的缺少,建立了CNLIP1和CNLIP2两个较大的汉语唇语数据库;其次,为了保留唇语的时序性,采用堆叠卷积独立子空间分析(ISA)深度神经网络模型来实现唇动时序特征的提取;最后提出使用迁移学习算法来训练特定人唇语识别模型。实验证明,唇动时序特征能更好地表征出数字串唇语,迁移学习训练的特定人唇语模型能够满足活体检测的需要,所构建的高安全性人脸识别系统具有较好的防攻击效果。 展开更多
关键词 高安全性 人脸识别 活体检测 唇语识别 迁移学习
下载PDF
唇语识别关键技术研究进展 被引量:4
9
作者 荣传振 岳振军 +2 位作者 贾永兴 王渊 杨宇 《数据采集与处理》 CSCD 北大核心 2012年第S2期277-283,共7页
唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统... 唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统的各环节入手综述了该领域的最新研究进展,并讨论了现有方法的优缺点,最后提出了唇语识别新的应用领域和有待进一步研究的问题。 展开更多
关键词 唇语识别 特征提取 信息融合 言模型
下载PDF
LipSense:基于CSI相位差的自适应唇语识别方法 被引量:1
10
作者 陶志勇 陈露 +1 位作者 刘影 郭京 《传感技术学报》 CAS CSCD 北大核心 2023年第3期419-426,共8页
针对目前基于CSI幅度的行为识别方法对细粒度动作不敏感及传统的动作分割算法存在动作起止点判断不准确的问题,提出了一种基于相位差的自适应唇语识别方法。首先,利用MIMO系统的空间分集,构造出对细粒度动作更敏感的相位差信号,解决了... 针对目前基于CSI幅度的行为识别方法对细粒度动作不敏感及传统的动作分割算法存在动作起止点判断不准确的问题,提出了一种基于相位差的自适应唇语识别方法。首先,利用MIMO系统的空间分集,构造出对细粒度动作更敏感的相位差信号,解决了细粒度动作感知不易的问题;然后利用OFDM子载波的频率分集来补偿小尺度衰落效应,以增强信号的空间感知能力;再次,通过研究唇语信号独特的变化模式,提出基于迭代方差曲线的自适应唇语分割模型;最后设计用于表示和匹配唇语特征的识别技术。在真实环境下的实验表明,所提方法在单人情况下平均识别精度达到94.3%,三人的综合识别准确率可达85.7%。在实验者佩戴金属饰品、网络被他人共享、以及周围有人移动等对比实验下,系统仍能实现较高的准确率。 展开更多
关键词 唇语识别 信道状态信息 相位差 自适应分割 迭代方差
下载PDF
唇语语料库综述 被引量:6
11
作者 马金林 陈德光 +1 位作者 郭贝贝 周洁 《计算机工程与应用》 CSCD 北大核心 2019年第22期1-13,52,共14页
优秀的语料库能为唇语识别提供良好的基础保障,但通用语料库的缺乏是导致唇语识别发展缓慢的重要原因之一。较为全面地综述了20多种语料库的相关特性。简单介绍了唇语识别的传统方法和深度学习方法。重点整理了近20多年较有影响力的唇... 优秀的语料库能为唇语识别提供良好的基础保障,但通用语料库的缺乏是导致唇语识别发展缓慢的重要原因之一。较为全面地综述了20多种语料库的相关特性。简单介绍了唇语识别的传统方法和深度学习方法。重点整理了近20多年较有影响力的唇语语料库,从识别对象、语料规模、录制方式与录制环境等12个方面进行比较分析,得出各种语料库的优缺点及适用范围,方便唇读工作者快速找到适合自己研究方向的语料库。比较了各种语料库采用何种算法及其所能达到的性能。对唇读面临的困难进行了剖析,对未来工作进行了展望。 展开更多
关键词 唇语识别 唇语料库 深度学习 交叉领域
下载PDF
基于自注意力序列模型的唇语识别研究
12
作者 王媛媛 王沛 吴开存 《电子器件》 CAS 北大核心 2021年第3期624-627,共4页
唇语识别任务本身具有复杂性和多样性,为了应对这些挑战,提出了一种基于自注意力序列模型的唇语识别方法,并在带有上下文信息的单词级唇语识别任务中取得了很好的结果,模型在LRW数据集上的Top1准确率为84.79%,比主流的方法提高了2.75%... 唇语识别任务本身具有复杂性和多样性,为了应对这些挑战,提出了一种基于自注意力序列模型的唇语识别方法,并在带有上下文信息的单词级唇语识别任务中取得了很好的结果,模型在LRW数据集上的Top1准确率为84.79%,比主流的方法提高了2.75%的准确率。通过多方面详细的分析和比较,证明了自注意力机制能有效提高唇语识别的性能。 展开更多
关键词 唇语识别 注意力机制 序列模型 深度学习
下载PDF
基于光流与注意力机制的句级唇语识别
13
作者 许文稼 李克 《电子器件》 CAS 北大核心 2023年第5期1339-1348,共10页
唇语识别技术是一种利用视觉线索理解人类语言的手段,在人机交互、安防验证、公共安全等领域都有着广泛的应用空间。现阶段的相关研究大多难以有效地完成语句级别的唇语识别任务。设计了一种基于光流与注意力机制的句级唇语识别系统,能... 唇语识别技术是一种利用视觉线索理解人类语言的手段,在人机交互、安防验证、公共安全等领域都有着广泛的应用空间。现阶段的相关研究大多难以有效地完成语句级别的唇语识别任务。设计了一种基于光流与注意力机制的句级唇语识别系统,能够将连续的唇读视频逐句解码为文字。系统由前端的唇读端点检测模块和端对端的神经网络构成,网络的图像特征提取模块基于3D-ResNet18与空间-通道双重注意力机制,时间序列分类模块基于Transformer和集束搜索解码器。唇读端点检测模块基于光流的阈值变化进行判别,对连续输入神经网络的唇读视频按句进行切分。神经网络的训练采用基于标签平滑的KL散度作为损失,并采取样本长度递增、学习率预热、逐级迁移学习等改进策略。模型的评估在英文数据集GRID和中文数据集CMLR上进行,在错误率上相较于基线结果分别降低了3.11%和1.21%。 展开更多
关键词 唇语识别 注意力机制 编码器-解码器 光流
下载PDF
唇语识别中的话题相关语言模型研究
14
作者 王渊 岳振军 贾永兴 《微计算机信息》 2012年第10期115-117,195,共4页
为了提高唇语识别的精度,研究提出了改进的话题相关的统计语言模型。基于关键词的基础上,通过主题词来划分话题,采用改进的场景训练语料设计与参数估计方法,将不同的话题的场景训练语料表示为整个场景训练语料库的模糊子集,参数估计也... 为了提高唇语识别的精度,研究提出了改进的话题相关的统计语言模型。基于关键词的基础上,通过主题词来划分话题,采用改进的场景训练语料设计与参数估计方法,将不同的话题的场景训练语料表示为整个场景训练语料库的模糊子集,参数估计也利用不同的话题的模糊训练集获取。改进方法较好的缓解了普通语言模型训练语料不足而引入的数据稀疏的问题,对场景训练语料与话题之间的联系强度给出了定量描述。 展开更多
关键词 唇语识别 统计言模型 话题相关 模糊训练
下载PDF
基于端到端句子级别的中文唇语识别研究 被引量:6
15
作者 张晓冰 龚海刚 +1 位作者 杨帆 戴锡笠 《软件学报》 EI CSCD 北大核心 2020年第6期1747-1760,共14页
近年来,随着深度学习的广泛应用,唇语识别技术也取得了快速的发展.与传统的方法不同,在基于深度学习的唇语识别模型中,通常包含使用神经网络对图像进行特征提取和特征理解两个部分.根据中文唇语识别的特点,将识别过程划分为两个阶段—... 近年来,随着深度学习的广泛应用,唇语识别技术也取得了快速的发展.与传统的方法不同,在基于深度学习的唇语识别模型中,通常包含使用神经网络对图像进行特征提取和特征理解两个部分.根据中文唇语识别的特点,将识别过程划分为两个阶段——图片到拼音(P2P)以及拼音到汉字(P2CC)的识别.分别设计两个不同子网络针对不同的识别过程,当两个子网络训练好后,再把它们放在一起进行端到端的整体架构优化.由于目前没有可用的中文唇语数据集,因此采用半自动化的方法从CCTV官网上收集了6个月20.95GB的中文唇语数据集CCTVDS,共包含14975个样本.此外,额外采集了269558条拼音汉字样本数据对拼音到汉字识别模块进行预训练.在CCTVDS数据集上的实验结果表明,所提出的ChLipNet可分别达到45.7%的句子识别准确率和58.5%的拼音序列识别准确率.此外,ChLipNet不仅可以加速训练、减少过拟合,并且能够克服汉语识别中的歧义模糊性. 展开更多
关键词 中文唇语识别 深度学习 中文汉言的特征 数据集采集及处理 端到端模型
下载PDF
一种基于long short-term memory的唇语识别方法 被引量:3
16
作者 马宁 田国栋 周曦 《中国科学院大学学报(中英文)》 CSCD 北大核心 2018年第1期109-117,共9页
唇动视觉信息是说话内容的重要载体。受嘴唇外观、背景信息和说话习惯等影响,即使说话者说相同的内容,唇动视觉信息也会相差很大。为解决唇语视觉信息多样性的问题,提出一种基于long short-term memory(LSTM)的新的唇语识别方法。以往... 唇动视觉信息是说话内容的重要载体。受嘴唇外观、背景信息和说话习惯等影响,即使说话者说相同的内容,唇动视觉信息也会相差很大。为解决唇语视觉信息多样性的问题,提出一种基于long short-term memory(LSTM)的新的唇语识别方法。以往大多数的方法从嘴唇外表信息入手。本方法用嘴唇关键点坐标描述嘴唇形变信息作为唇语视频的特征,它具有类内一致性和类间区分性的特点。然后利用LSTM对特征进行时序编码,它能学习具有区分性和泛化性的空间-时序特征。在公开的唇语数据集GRID、MIRACL-VC和Oulu VS上对本方法做了针对分割的单词或短语的说话者独立的唇语识别评估。在GRID和MIRACL-VC上,本方法的准确率比传统方法至少高30%;在Oulu VS上,本方法的准确率接近于最优结果。以上实验结果表明,本文提出的基于LSTM的唇语识别方法有效地解决了唇语视觉信息多样性的问题。 展开更多
关键词 唇语识别 LONG SHORT-TERM MEMORY 计算机视觉
下载PDF
基于BiLSTM-Attention唇语识别的研究 被引量:2
17
作者 刘大运 房国志 +4 位作者 骆天依 魏华杰 王倩 李修政 李骜 《计算技术与自动化》 2020年第1期150-155,共6页
为了解决唇语识别中唇部特征提取和时序关系识别存在的问题,提出了一种双向长短时记忆网络(BiLSTM)和注意力机制(Attention Mechanism)相结合的深度学习模型。首先将唇部20个关键点得到的唇部不同位置的高度和宽度作为唇部的特征,使用Bi... 为了解决唇语识别中唇部特征提取和时序关系识别存在的问题,提出了一种双向长短时记忆网络(BiLSTM)和注意力机制(Attention Mechanism)相结合的深度学习模型。首先将唇部20个关键点得到的唇部不同位置的高度和宽度作为唇部的特征,使用BiLSTM对唇部特征序列进行时序编码,然后利用注意力机制来发掘不同时刻唇部时序特征对于整体唇语识别的不同权重,最后利用Softmax进行分类。在公开的唇语识别数据集GRID和MIRACL-VC上与传统的唇语识别模型进行实验对比。在GRID数据集上准确率至少提高了13.4%,在MIRACL-VC单词数据集上准确率至少提高了15.3%,短语数据集上准确率至少提高了9.2%。同时还与其他编码模型进行了实验对比,实验结果表明该模型能有效地提高唇语识别的准确率。 展开更多
关键词 唇语识别 双向长短时记忆网络 注意力机制 深度学习 时序编码
下载PDF
基于时域卷积网络的中文句子级唇语识别算法 被引量:1
18
作者 刘培培 贾静平 《计算机应用研究》 CSCD 北大核心 2023年第9期2596-2602,共7页
针对现有中文句子级唇语识别技术存在的视觉歧义、特征提取不充分导致识别准确率偏低的问题,提出了一种基于时域卷积网络,采用三维时空卷积的中文句子级唇语识别算法——3DT-CHLipNet(Chinese LipNet based on 3DCNN,TCN)。首先,针对特... 针对现有中文句子级唇语识别技术存在的视觉歧义、特征提取不充分导致识别准确率偏低的问题,提出了一种基于时域卷积网络,采用三维时空卷积的中文句子级唇语识别算法——3DT-CHLipNet(Chinese LipNet based on 3DCNN,TCN)。首先,针对特征提取不充分的问题,所提算法采用了比长短期记忆网络(LSTM)感受野更大的时域卷积网络(temporal convolutional network,TCN)来提取长时依赖信息;其次,针对中文唇语识别中存在的“同型异义”视觉歧义问题,将自注意力机制应用于中文句子级唇语识别,以更好地捕获上下文信息,提升了句子预测准确率;最后,在数据预处理方面引入了时间掩蔽数据增强策略,进一步降低了算法模型的错误率。在最大的开源汉语普通话句子级数据集CMLR上的实验测试表明,与现有中文句子级唇语识别代表性算法相比,所提算法的识别准确率提高了2.17%至23.99%。 展开更多
关键词 中文唇语识别 深度学习 时域卷积网络 注意力机制
下载PDF
基于单标签射频识别的唇语识别算法 被引量:1
19
作者 张瑛琪 彭大卫 +2 位作者 李森 孙莹 牛强 《计算机应用》 CSCD 北大核心 2022年第6期1762-1769,共8页
近年来,有研究提出了使用多个定制且可拉伸的射频识别(RFID)标签进行语音识别的无线平台,但该标签难以精准捕捉拉伸引起的大频率偏移,而且需要探测多个标签,标签脱落或自然磨损时还须重新校准。针对以上问题,提出基于单标签RFID的唇语... 近年来,有研究提出了使用多个定制且可拉伸的射频识别(RFID)标签进行语音识别的无线平台,但该标签难以精准捕捉拉伸引起的大频率偏移,而且需要探测多个标签,标签脱落或自然磨损时还须重新校准。针对以上问题,提出基于单标签RFID的唇语识别算法,将灵活、易于隐藏且没有侵入性的单个通用RFID标签贴在脸上,即使用户不发出声音,仅依靠面部的微动作也可进行唇语识别。首先建立模型处理RFID阅读器接收的单个标签随时间和频率响应的接收信号强度(RSS)和相位变化,然后采用高斯函数对原始数据的噪点进行平滑去噪预处理,再采用动态时间规整(DTW)算法对收集到的信号特征进行评估分析,以解决发音长短不匹配的问题;最后创建无线语音识别系统来识别区分与声音相对应的面部表情,从而达到识别唇语的目的。实验结果表明,对于识别不同用户的200组数字信号特征,该方法的RSS准确率可以达到86.5%以上。 展开更多
关键词 射频识别 唇语识别 单标签 接收信号强度 动态时间规整
下载PDF
基于唇语识别的身份认证研究及系统设计 被引量:1
20
作者 胡中坚 冯晗 +1 位作者 陈飞宇 张文强 《计算机系统应用》 2021年第5期59-65,共7页
随着人脸识别身份认证技术的广泛应用,各类针对人脸识别系统的攻击手段逐渐出现.为了应对这类安全性问题,提出了基于唇语识别的身份认证方法.基于唇语识别的身份认证系统要求用户在进行人脸识别认证的同时读出验证码,系统既要对人脸进... 随着人脸识别身份认证技术的广泛应用,各类针对人脸识别系统的攻击手段逐渐出现.为了应对这类安全性问题,提出了基于唇语识别的身份认证方法.基于唇语识别的身份认证系统要求用户在进行人脸识别认证的同时读出验证码,系统既要对人脸进行比对,还要通过唇语识别技术识别出说话内容并与验证码进行比对,只有两部分比对都通过才能通过系统的身份认证.最后设计了基于唇语识别的身份认证系统,主要包括前端、网关和后端. 展开更多
关键词 身份认证 唇语识别 人脸识别系统 CNN LSTM
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部