期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
188
篇文章
<
1
2
…
10
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
改进YOLOv7-tiny的手语识别算法研究
被引量:
2
1
作者
韩晓冰
胡其胜
+1 位作者
赵小飞
秋强
《现代电子技术》
北大核心
2024年第1期55-61,共7页
在与听障人士进行交流时,常常会面临交流不便的困难,文中提出一种手语识别的改进模型来解决这个困难。该模型基于YOLOv7-tiny网络模型,并对其进行了多项改进,旨在提高模型的精度和速度。首先,通过对CBAM注意力机制的通道域进行改进,解...
在与听障人士进行交流时,常常会面临交流不便的困难,文中提出一种手语识别的改进模型来解决这个困难。该模型基于YOLOv7-tiny网络模型,并对其进行了多项改进,旨在提高模型的精度和速度。首先,通过对CBAM注意力机制的通道域进行改进,解决了因降维而造成的通道信息缺失问题,并将改进后的CBAM加入到YOLOv7-tiny的Neck层中,从而使模型更加精准地定位和识别到关键的目标;其次,将传统的CIoU边界框损失函数替换为SIoU边界框损失函数,以加速边界框回归的同时提高定位准确度;此外,为了减少计算量并加快检测速度,还将颈部层中的普通卷积模块替换为Ghost卷积模块。经过实验测试,改进后网络模型的平均精度均值(mAP)、精准率和召回率分别提升了5.31%、6.53%、2.73%,有效地提高了手语识别网络的检测精确度。
展开更多
关键词
手语识别
YOLOv7-tiny
Ghost卷积
注意力机制
SIoU
边界框
下载PDF
职称材料
基于图神经网络和潜在空间的连续手语识别方法
2
作者
邵俊倩
王铁滨
《绥化学院学报》
2024年第6期146-150,共5页
近年来出现的以潜在空间和分层注意力网络为基础的手语识别技术采用双通路卷积网络进行特征提取,针对大规模连续而非孤立手语数据集进行识别,大幅度提高了识别精度。由于卷积神经网络变换器将图像视为网络或序列结构,对于捕获不规则和...
近年来出现的以潜在空间和分层注意力网络为基础的手语识别技术采用双通路卷积网络进行特征提取,针对大规模连续而非孤立手语数据集进行识别,大幅度提高了识别精度。由于卷积神经网络变换器将图像视为网络或序列结构,对于捕获不规则和复杂的手语使用者即人形对象不够灵活,因此,文章将特征提取模块由卷积网络替换为图神经网络,运用图神经网络直接对连续手语视频进行特征提取,并重新调整了部分网络结构与参数以保证图神经网络特征提取模块和后续模块能够无缝融合。实验证明,融合后的新模型有效提升了手语识别的精度。
展开更多
关键词
手语识别
技术
连续
手语
听障教学
图神经网络
下载PDF
职称材料
基于手语表达内容与表达特征的手语识别技术综述
被引量:
2
3
作者
陶唐飞
刘天宇
《电子与信息学报》
EI
CSCD
北大核心
2023年第10期3439-3457,共19页
手语识别(SLR)技术是打破听障人群与健听人群间交流壁垒的重要技术手段。该文综述了近几年的手语数据集、评价指标以及手语识别方法。首先,系统梳理了手语数据集并分析了手语识别方法的数据集发展方向。其次,详细介绍了手语识别方法的...
手语识别(SLR)技术是打破听障人群与健听人群间交流壁垒的重要技术手段。该文综述了近几年的手语数据集、评价指标以及手语识别方法。首先,系统梳理了手语数据集并分析了手语识别方法的数据集发展方向。其次,详细介绍了手语识别方法的评价指标。然后,根据手语表达内容、手语识别方法所采用的特征分类总结分析了孤立词手语识别方法与连续语句识别方法、仅依靠手部特征的手语识别方法与多特征融合的手语识别方法。最后探讨了手语识别技术面临的挑战及其发展方向。
展开更多
关键词
手语识别
技术
手语
数据集
孤立词
手语识别
连续
手语识别
多特征融合
手语识别
下载PDF
职称材料
模块化连续手语识别算法及技术综述
4
作者
孟巾凯
彭健钧
+3 位作者
肖智东
郭立
金凯
郑彤
《小型微型计算机系统》
CSCD
北大核心
2024年第10期2428-2441,共14页
手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续...
手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续手语识别仍然面临着冗余帧过多,空间特征提取和时间特征提取网络不平衡,手语语序与文本语序不匹配等诸多问题.因此,研究准确率高、耗时少、场景通用性高的连续手语识别算法成为计算机视觉领域的热点问题之一.本文首先分析单模态和多模态的连续手语识别框架,并重点阐述关键帧提取、特征提取、序列学习3个模块在连续手语识别中的作用,以及模块中所用网络的优势与不足,然后总结连续手语数据集以及识别结果的评价指标,最后阐述连续手语识别算法的难点并展望其未来的发展方向.
展开更多
关键词
关键帧提取
特征提取
序列学习
连续
手语识别
综述
下载PDF
职称材料
多尺度视觉特征提取及跨模态对齐的连续手语识别
5
作者
郭乐铭
薛万利
袁甜甜
《计算机科学与探索》
CSCD
北大核心
2024年第10期2762-2769,共8页
连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方...
连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方法主要包含多尺度视觉特征提取模型和跨模态对齐约束。在多尺度视觉特征提取模型中,并行地融合具备不同扩张因子的瓶颈残差结构,来丰富多尺度时序感受野,用于提取不同时序长度的手语视觉特征,同时采用层级复用设计进一步强化视觉特征表示。在跨模态对齐约束中,采用动态时间规整建模手语视觉特征和文本特征之间的内在联系,其中,文本特征提取由多层感知机和长短期记忆网络协作实现。在具备挑战性的公开数据集RWTH-2014、RWTH-2014T、CSL-Daily上进行实验,结果表明所提方法达到目前具有竞争力的性能。上述实验验证了所提的采用多尺度的方式可以捕捉不同时序长度的手语动作,以及构建跨模态对齐约束的思路是正确且有效的,适用于弱监督条件下的连续手语识别任务。
展开更多
关键词
连续
手语识别
多尺度
跨模态对齐约束
视频视觉特征
文本特征
下载PDF
职称材料
中国手语识别方法及技术综述
6
作者
蒋贤维
孙计领
+3 位作者
张艳琼
王立平
蒋小艳
韩雪
《现代特殊教育》
2024年第6期47-58,共12页
中国手语具有自己独特的文化内涵和复杂表达,是近3000万听障人士融入社会的重要手段。手语识别技术能帮助听障人士走出信息孤岛,和健听人建立有效沟通。中国手语识别方法大致经历了传统技术识别和现代智能识别两个时期。前者主要包含数...
中国手语具有自己独特的文化内涵和复杂表达,是近3000万听障人士融入社会的重要手段。手语识别技术能帮助听障人士走出信息孤岛,和健听人建立有效沟通。中国手语识别方法大致经历了传统技术识别和现代智能识别两个时期。前者主要包含数据收集、预处理、特征提取和分类识别四个主要阶段,主流技术有HMMs、SVM和DTW等,基于手语手形数据完成识别,不依赖海量样本数据;后者主要利用深度神经网络和人工智能技术,强调深度学习,迁移学习和技术融合,模型对样本数据量的依赖程度较高。我国已经开始广泛建设各类手语语料库,但需要进一步规范和推广。
展开更多
关键词
手语识别
技术
语料库
深度神经网络
迁移学习
下载PDF
职称材料
基于X-CUBE-AI的神经网络手语识别系统设计
7
作者
牛帅
宗诗怡
+2 位作者
胡威
许彬
董振华
《工业控制计算机》
2024年第3期21-23,共3页
手语交流是聋哑人与他人交流的主要方法,设计了一款基于STM32的神经网络手语识别系统,采用TensorFlow和Keras机器学习框架训练网络模型,由于训练数据的局限性,加入L2正则化以解决训练过拟合问题。使用意法半导体推出的STM32Cube.AI工具...
手语交流是聋哑人与他人交流的主要方法,设计了一款基于STM32的神经网络手语识别系统,采用TensorFlow和Keras机器学习框架训练网络模型,由于训练数据的局限性,加入L2正则化以解决训练过拟合问题。使用意法半导体推出的STM32Cube.AI工具包在STM32嵌入式平台上部署神经网络,搭载OV2640摄像头采集图像并进行缩放处理,将图像数据传入网络进行推理可获得识别结果。经测试,网络模型获得了较好的鲁棒性和适应性,在STM32上运行平均每帧推理时间为15.8 ms,平均准确率达92.3%。使用STM32作为手语识别终端,极大地提高了设备的便携性,节约成本,反应迅速。为聋哑人与正常人交流提供了一种新的解决方案,具有较高的实际应用价值。
展开更多
关键词
手语识别
X-CUBE-AI
过拟合
神经网络
L2正则化
STM32
图像
识别
下载PDF
职称材料
基于改进的YOLOv5s结构的手语识别设计
8
作者
潘丽
《西昌学院学报(自然科学版)》
2024年第2期49-55,61,共8页
听力障碍者需要通过手语等方式才能进行沟通交流,但是大部分听力正常的群众不会解读手语。为解决该问题,创建了手语数据集,并提出一种基于YOLOv5改进的手语识别模型。该模型采用轻量级网络结构MobileNetV3替换了YOLOv5目标检测算法的骨...
听力障碍者需要通过手语等方式才能进行沟通交流,但是大部分听力正常的群众不会解读手语。为解决该问题,创建了手语数据集,并提出一种基于YOLOv5改进的手语识别模型。该模型采用轻量级网络结构MobileNetV3替换了YOLOv5目标检测算法的骨干网络,取得了很好的效果。经过测试,改进后的模型在手语识别数据集中检测平均精度均值(mAP)达到98.5%,召回率(Recall)为0.92,F1(F1 score)分数为0.929。研究提出的模型在提高训练速度、减少参数量的同时,提高了手语识别的精度,满足实际检测需求。
展开更多
关键词
YOLOv5
MobileNetV3
手语识别
下载PDF
职称材料
基于关键帧和注意力残差网络的手语识别
被引量:
3
9
作者
刘群坡
盛月琴
+1 位作者
高如新
卜旭辉
《计算机工程》
CAS
CSCD
北大核心
2023年第12期224-230,242,共8页
手语识别研究对于改善聋哑人生活质量具有重要意义,同时可促进人机交互领域的发展。针对手语视频中存在大量的无关帧、手语识别过程中手部细节信息提取不足、难以精确定位手语动作的位置和时间信息导致识别率不高等问题,提出一种基于关...
手语识别研究对于改善聋哑人生活质量具有重要意义,同时可促进人机交互领域的发展。针对手语视频中存在大量的无关帧、手语识别过程中手部细节信息提取不足、难以精确定位手语动作的位置和时间信息导致识别率不高等问题,提出一种基于关键帧和交互式注意力残差网络的手语识别方法。在数据预处理部分,设计基于图像相似度和模糊程度的关键帧提取算法,从基于Farneback光流法获取的大量候选关键帧中确定最终的关键帧,减少无关冗余信息。在网络部分,以3D-ResNet为基础框架,构建小卷积模块增强网络对手语视频中细粒度特征的提取能力,设计在捷径分支中采用池化卷积下采样方式的残差结构减小特征图失真程度,建立融合通道注意力和空间注意力的交互式四重注意力模块强化对目标区域关键特征的提取。实验结果表明,该方法在CSL和DEVISIGN数据集上取得了92.0%和92.2%的准确率,优于其他手语识别方法。
展开更多
关键词
手语识别
关键帧
残差网络
空间注意力
通道注意力
下载PDF
职称材料
基于无线传感技术与卷积神经网络的静态手语识别方法
被引量:
2
10
作者
吕军
强彦
《传感技术学报》
CAS
CSCD
北大核心
2023年第4期623-628,共6页
基于传感网络的手语识别随着手势复杂程度的提升,识别的难度增大,因此,为了获取更加精准的静态手语识别结果,提出了基于无线传感技术与卷积神经网络的静态手语识别方法。通过无线传感技术对静态手语图像进行滤波处理,采用特征提取方法...
基于传感网络的手语识别随着手势复杂程度的提升,识别的难度增大,因此,为了获取更加精准的静态手语识别结果,提出了基于无线传感技术与卷积神经网络的静态手语识别方法。通过无线传感技术对静态手语图像进行滤波处理,采用特征提取方法提取静态手语特征并进行融合处理,将融合后的连续二维特征图像直接转换为一维向量,将其作为卷积神经网络的输入,通过迭代训练完成静态手语识别。实验结果表明,所提方法在不同场景下静态手语识别精度高于94.11%,且识别速度较快,由此验证了所提方法可以快速准确完成静态手语识别。
展开更多
关键词
无线传感技术
卷积神经网络
静态
手语
图像滤波
手语识别
下载PDF
职称材料
基于身体姿态关键点检测及算法融合的连续手语识别
11
作者
陈雅茜
吴非
赵丁皓
《西南民族大学学报(自然科学版)》
CAS
2023年第2期165-172,共8页
连续手语识别相对于单个手语词识别来说,更加具有研究意义也更加具有研究难度.连续手语识别需要更关注整体语句在时间上的依赖关系,以及语句中手语词结束与开始的时序分割问题.而对此的单个识别算法的研究与优化,短时间都很难再有较大...
连续手语识别相对于单个手语词识别来说,更加具有研究意义也更加具有研究难度.连续手语识别需要更关注整体语句在时间上的依赖关系,以及语句中手语词结束与开始的时序分割问题.而对此的单个识别算法的研究与优化,短时间都很难再有较大的突破.因此,我们提出一种基于算法融合的连续手语识别方法,先通过帧间差分法处理关键帧,再通过MediaPipe检测并保存关键点数据,降低数据量,并提供有效、直接的数据;再通过CNN+BLSTM算法融合模型,让CNN专注局部感知,捕捉空间特征关系;BLSTM则侧重特征序列的时序建模,突出连续手语在时间纬度上的依赖关系.最后结合CTC完成标签和语句对齐问题.该算法在CSL数据集上取得了98.4%的平均识别率.
展开更多
关键词
连续
手语识别
深度学习
CNN
BLSTM
身体姿态
下载PDF
职称材料
基于视频的中文连续手语识别算法
被引量:
1
12
作者
刘诗瑶
张忠民
《应用科技》
CAS
2023年第3期44-49,共6页
连续手语识别是将视频序列转为符号序列的典型的弱监督问题,它只提供了句子级标签,没有提供有时间边界的帧级标签。为了克服这一问题,就需要使用连接时态分类(connectionist temporal classification,CTC),这也是目前应用最广泛的方法...
连续手语识别是将视频序列转为符号序列的典型的弱监督问题,它只提供了句子级标签,没有提供有时间边界的帧级标签。为了克服这一问题,就需要使用连接时态分类(connectionist temporal classification,CTC),这也是目前应用最广泛的方法。实验在特征提取阶段引入时间-空间注意力机制,并增加辅助对齐模块,利用聚合交叉熵(agregation cross-entropy,ACE)散度损失对特征提取部分进行训练。该模型采用端到端方式,结合ACE散度进行片段级特征学习和CTC进行全局序列特征学习的联合训练,此外,提出的随机掉帧机制还可以进一步缓解过拟合问题。在中文手语数据集CSLR上验证了改进方法的有效性,在验证集上获得了6.9%错误率,在测试集上获得了4.3%错误率。
展开更多
关键词
连续
手语识别
注意力机制
时间-空间注意力机制
连接时态分类
联合训练
弱监督
跨模态
深度学习
下载PDF
职称材料
长短时记忆脉冲神经网络手语识别模型
13
作者
冯一飞
王青山
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2023年第11期1479-1483,1541,共6页
手语识别是人机交互领域中的重要问题之一。随着人工智能技术的发展,越来越多的机器学习和深度学习方法被应用在手语识别任务上。文章设计一种轻量级的长短时记忆脉冲神经网络(long short-term memory-spiking neural network,LSTM-SNN...
手语识别是人机交互领域中的重要问题之一。随着人工智能技术的发展,越来越多的机器学习和深度学习方法被应用在手语识别任务上。文章设计一种轻量级的长短时记忆脉冲神经网络(long short-term memory-spiking neural network,LSTM-SNN)手语识别模型用于识别常用手语。首先提出自适应脉冲编码,将手语信号转化为脉冲信号;接着将脉冲信号输入到改进的带泄漏整合发放(leaky integrate-and-fire,LIF)神经元模型,以时间驱动的方式进行信息传导,完成网络训练。在收集到的101个手语手势数据集上的实验结果表明,该模型准确率达到95.37%,表明该文提出的模型优于其他深度学习和机器学习模型。
展开更多
关键词
深度学习
模式
识别
长短时记忆网络(LSTM)
脉冲神经网络(SNN)
手语识别
下载PDF
职称材料
基于SlowFast网络的孤立词手语识别算法研究
被引量:
1
14
作者
黄同愿
谭禹
朱金江
《重庆理工大学学报(自然科学)》
CAS
北大核心
2023年第12期267-275,共9页
由于运动模糊、信息冗余以及不同人手语风格多样化等原因,目前的孤立词手语识别在识别精度、背景抗干扰性和识别速度等方面仍存在不足。为此,提出了一种新的手语识别方法——基于SlowFast网络和增强手部注意力的方法(EAH-SlowFast),其使...
由于运动模糊、信息冗余以及不同人手语风格多样化等原因,目前的孤立词手语识别在识别精度、背景抗干扰性和识别速度等方面仍存在不足。为此,提出了一种新的手语识别方法——基于SlowFast网络和增强手部注意力的方法(EAH-SlowFast),其使用YOLOv5和DeepSort检测并追踪手部,提高对手部信息的关注度;在骨干网络中使用Focal损失函数增加模型的分类能力;改进了SlowFast网络结构并引入通道空间注意力机制,从而提高手部信息的权重并抑制背景噪声的干扰。此外,还提出了一种关键帧提取算法,可以在一定精度的损失下大大提高效率。经实验证实,EAH-SlowFast在DEVISIGN-D数据集上的Top-5准确率达到了97.79%,优于其他先进的手语识别算法。
展开更多
关键词
孤立词
手语识别
注意力机制
SlowFast
关键帧提取
下载PDF
职称材料
面向智慧博物馆的基于毫米波雷达稳健的手语识别
15
作者
赵学荣
王旋
+2 位作者
刘彤
郑霞
江翼成
《电信科学》
2023年第8期109-117,共9页
智慧博物馆是利用物联网、人工智能等设备或技术,构建人、物、空间信息交互通道的博物馆新形态。手语识别技术既能让听障语障观众无障碍参观博物馆,也有助于解析观众自然状态下的手势互动。然而,基于摄像头或可穿戴设备的方法在博物馆...
智慧博物馆是利用物联网、人工智能等设备或技术,构建人、物、空间信息交互通道的博物馆新形态。手语识别技术既能让听障语障观众无障碍参观博物馆,也有助于解析观众自然状态下的手势互动。然而,基于摄像头或可穿戴设备的方法在博物馆中可能有隐私安全或使用不便等问题。提出一种基于毫米波雷达稳健的手语识别方法,首先提取不同手势相对于雷达距离和速度随时间变化的特征,其次采用基于物理意义的增强处理,最后设计残差网络进一步剔除两种特征预处理后的与环境相关信息,对其进行特征融合并实现分类。实验表明,该方法可以有效识别手语,在测试环境和用户位置改变时也能达到平均90%以上的精度,为智慧博物馆的手语手势识别提供了一种新方法。
展开更多
关键词
手语识别
毫米波雷达
残差网络
智慧博物馆
下载PDF
职称材料
基于残差时移模块和双流网络的手语识别方法
16
作者
蔡畅
林靖宇
《计算机与数字工程》
2023年第12期2841-2845,2851,共6页
目前存在的手语识别方法中,多模态图像被广泛使用,但多模态数据形式复杂,不易操作。此外,现存的手语识别方法无法有效聚合全局与运动区域局部信息。基于改善手语识别方法的目的,论文提出了一种仅使用RGB图像的基于残差时移模块与双流网...
目前存在的手语识别方法中,多模态图像被广泛使用,但多模态数据形式复杂,不易操作。此外,现存的手语识别方法无法有效聚合全局与运动区域局部信息。基于改善手语识别方法的目的,论文提出了一种仅使用RGB图像的基于残差时移模块与双流网络的手语识别方法。双流网络两分支改进为全局图像分支与运动区域局部分支,运动区域局部分支采用语义分割算法进行运动区域分割,解决了以往运动区域难以定位的问题。两分支通过数据融合将全局与局部信息有效聚合。在SLR500开源数据集上进行实验,该方法获得高达94.7%的识别率。
展开更多
关键词
手语识别
双流网络
时域位移
全局特征
运动区域局部分割
数据融合
下载PDF
职称材料
基于智能眼镜的手语识别系统设计
被引量:
1
17
作者
刘又瑜
谢本齐
+1 位作者
江焕
姜林
《电脑知识与技术》
2023年第4期18-20,共3页
手语识别对于听障人士交流具有重要的意义。现有机器视觉手语识别系统存在因移动设备端算力不足,各框架兼容条件苛刻影响实时应用的问题。针对该问题,本文提出基于智能眼镜硬件平台和云端计算的实时手语识别系统。该系统采用智能眼镜捕...
手语识别对于听障人士交流具有重要的意义。现有机器视觉手语识别系统存在因移动设备端算力不足,各框架兼容条件苛刻影响实时应用的问题。针对该问题,本文提出基于智能眼镜硬件平台和云端计算的实时手语识别系统。该系统采用智能眼镜捕获手语动作,并将该视频图片上传至云端服务器,利用部署在云端服务器上的深度学习模型对手语进行识别,最后将识别结果返回至智能眼镜。本系统深度学习识别网络采用TSN和LSTM相结合的方式,利用TSN视频动作分类能力和LSTM上下文信息建模能力准确识别手语动作。试验结果表明,本系统实时识别精度可达到95.37%,对于听障人士实时交流具有较好的应用价值。
展开更多
关键词
智能眼镜
云服务
手语识别
听障人士
智能系统
下载PDF
职称材料
基于混合注意力机制的中文孤立词手语识别
18
作者
陈晓燚
杨波
+1 位作者
余辉
黄国航
《信息技术与信息化》
2023年第10期194-199,共6页
手语识别技术能帮助听障人士与健听人士进行交流。当前,随着社会的快速发展,深度学习技术也为手语识别工作提供了一定的技术支持。然而在手语识别任务中,使用传统的卷积神经网络对手语视频进行时空特征的提取时,存在特征提取不充分而导...
手语识别技术能帮助听障人士与健听人士进行交流。当前,随着社会的快速发展,深度学习技术也为手语识别工作提供了一定的技术支持。然而在手语识别任务中,使用传统的卷积神经网络对手语视频进行时空特征的提取时,存在特征提取不充分而导致识别率低的问题。除此之外,由于手语视频中因背景光照、表演者体态不一致等问题也会影响到网络模型的识别效果。为解决上述问题,使用了一种基于混合注意力机制的手语识别模型,所提及的模型通过添加混合注意力机制的方式,用于增强对手语动作中重要区域的关注,并使用空间变换网络来增强模型的空间不变性,最终在SLR手语词数据集上完成实验验证。实验结果表明,所提及的模型准确率优于3DCNN、CNN结合LSTM等主流模型,能够有效提取手语视频中的时空特征,并提高对手语动作的识别能力。
展开更多
关键词
深度学习
注意力机制
手语识别
残差网络
长短记忆神经网络
下载PDF
职称材料
基于SRN/HMM的非特定人连续手语识别系统
被引量:
8
19
作者
方高林
高文
+2 位作者
陈熙霖
王春立
马继勇
《软件学报》
EI
CSCD
北大核心
2002年第11期2169-2175,共7页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精...
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径.实验结果表明,该方法的识别效果比单纯使用HMM要好.
展开更多
关键词
SRN
HMM
非特定人连续
手语识别
系统
神经网络
精简循环网络
隐马可夫规模
连续
手语识别
计算机
模式
识别
下载PDF
职称材料
基于机器学习的手语识别系统研究与开发
20
作者
尹昱杰
王启源
+2 位作者
裴中正
施浩男
刘顺意
《信息与电脑》
2023年第7期198-201,共4页
随着机器学习和计算机视觉领域的发展,计算机已经具有分析视频内容的能力。听障人士的交流困难主要是难以理解手语动作的含义,而借助计算机分析手语视频将其转化为文字,则可以解决以上交流难题。因此,提出基于机器学习的手语识别系统,...
随着机器学习和计算机视觉领域的发展,计算机已经具有分析视频内容的能力。听障人士的交流困难主要是难以理解手语动作的含义,而借助计算机分析手语视频将其转化为文字,则可以解决以上交流难题。因此,提出基于机器学习的手语识别系统,先建立手语视频数据集,借助飞桨AI Studio平台使用时间分段网络(Temporal Segments Networks,TSN)算法框架进行相应的模型训练,再对手语视频进行抽帧,分析图像内容并对其进行预测,最后输出预测结果,从而实现对手语视频的文字转译。
展开更多
关键词
机器学习
手语识别
时间分段网络(TSN)
模型训练
下载PDF
职称材料
题名
改进YOLOv7-tiny的手语识别算法研究
被引量:
2
1
作者
韩晓冰
胡其胜
赵小飞
秋强
机构
西安科技大学通信与信息工程学院
出处
《现代电子技术》
北大核心
2024年第1期55-61,共7页
基金
陕西省重点研发计划(2023-YBGY-255)
陕西省科技厅工业公关(2022GY-155)。
文摘
在与听障人士进行交流时,常常会面临交流不便的困难,文中提出一种手语识别的改进模型来解决这个困难。该模型基于YOLOv7-tiny网络模型,并对其进行了多项改进,旨在提高模型的精度和速度。首先,通过对CBAM注意力机制的通道域进行改进,解决了因降维而造成的通道信息缺失问题,并将改进后的CBAM加入到YOLOv7-tiny的Neck层中,从而使模型更加精准地定位和识别到关键的目标;其次,将传统的CIoU边界框损失函数替换为SIoU边界框损失函数,以加速边界框回归的同时提高定位准确度;此外,为了减少计算量并加快检测速度,还将颈部层中的普通卷积模块替换为Ghost卷积模块。经过实验测试,改进后网络模型的平均精度均值(mAP)、精准率和召回率分别提升了5.31%、6.53%、2.73%,有效地提高了手语识别网络的检测精确度。
关键词
手语识别
YOLOv7-tiny
Ghost卷积
注意力机制
SIoU
边界框
Keywords
sign language recognition
YOLOv7⁃tiny
Ghost convolution
attention mechanism
SIoU
boundary box
分类号
TN911.1-34 [电子电信—通信与信息系统]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于图神经网络和潜在空间的连续手语识别方法
2
作者
邵俊倩
王铁滨
机构
绥化学院信息工程学院
出处
《绥化学院学报》
2024年第6期146-150,共5页
基金
黑龙江省教育科学规划重点课题(ZHB1320006)。
文摘
近年来出现的以潜在空间和分层注意力网络为基础的手语识别技术采用双通路卷积网络进行特征提取,针对大规模连续而非孤立手语数据集进行识别,大幅度提高了识别精度。由于卷积神经网络变换器将图像视为网络或序列结构,对于捕获不规则和复杂的手语使用者即人形对象不够灵活,因此,文章将特征提取模块由卷积网络替换为图神经网络,运用图神经网络直接对连续手语视频进行特征提取,并重新调整了部分网络结构与参数以保证图神经网络特征提取模块和后续模块能够无缝融合。实验证明,融合后的新模型有效提升了手语识别的精度。
关键词
手语识别
技术
连续
手语
听障教学
图神经网络
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于手语表达内容与表达特征的手语识别技术综述
被引量:
2
3
作者
陶唐飞
刘天宇
机构
现代设计及转子轴承系统教育部重点实验室
西安交通大学机械工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第10期3439-3457,共19页
基金
陕西省重点研发计划(2020KWZ-003)。
文摘
手语识别(SLR)技术是打破听障人群与健听人群间交流壁垒的重要技术手段。该文综述了近几年的手语数据集、评价指标以及手语识别方法。首先,系统梳理了手语数据集并分析了手语识别方法的数据集发展方向。其次,详细介绍了手语识别方法的评价指标。然后,根据手语表达内容、手语识别方法所采用的特征分类总结分析了孤立词手语识别方法与连续语句识别方法、仅依靠手部特征的手语识别方法与多特征融合的手语识别方法。最后探讨了手语识别技术面临的挑战及其发展方向。
关键词
手语识别
技术
手语
数据集
孤立词
手语识别
连续
手语识别
多特征融合
手语识别
Keywords
Sign language Recognition Technique(SLR)
Sign language dataset
Isolated sign language recognition
Continuous sign language recognition
Multi feature fusion sign language recognition
分类号
TP3-05 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
模块化连续手语识别算法及技术综述
4
作者
孟巾凯
彭健钧
肖智东
郭立
金凯
郑彤
机构
大连工业大学信息科学与工程学院
伯恩茅斯大学国家计算机动画中心
辽宁省互联网舆情监测中心
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第10期2428-2441,共14页
基金
辽宁省教育厅科学研究经费项目(面上项目)(LJKZ0529)资助
国家留学基金项目(202008210334)资助.
文摘
手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续手语识别仍然面临着冗余帧过多,空间特征提取和时间特征提取网络不平衡,手语语序与文本语序不匹配等诸多问题.因此,研究准确率高、耗时少、场景通用性高的连续手语识别算法成为计算机视觉领域的热点问题之一.本文首先分析单模态和多模态的连续手语识别框架,并重点阐述关键帧提取、特征提取、序列学习3个模块在连续手语识别中的作用,以及模块中所用网络的优势与不足,然后总结连续手语数据集以及识别结果的评价指标,最后阐述连续手语识别算法的难点并展望其未来的发展方向.
关键词
关键帧提取
特征提取
序列学习
连续
手语识别
综述
Keywords
keyframe extraction
feature extraction
sequence learning
continuous sign language recognition
review
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
多尺度视觉特征提取及跨模态对齐的连续手语识别
5
作者
郭乐铭
薛万利
袁甜甜
机构
天津理工大学计算机科学与工程学院
天津理工大学聋人工学院
出处
《计算机科学与探索》
CSCD
北大核心
2024年第10期2762-2769,共8页
基金
国家自然科学基金(62376197,62020106004,92048301)
天津市研究生科研创新项目(2021YJSB244)
天津市科技计划项目(23JCYBJC00360)。
文摘
连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方法主要包含多尺度视觉特征提取模型和跨模态对齐约束。在多尺度视觉特征提取模型中,并行地融合具备不同扩张因子的瓶颈残差结构,来丰富多尺度时序感受野,用于提取不同时序长度的手语视觉特征,同时采用层级复用设计进一步强化视觉特征表示。在跨模态对齐约束中,采用动态时间规整建模手语视觉特征和文本特征之间的内在联系,其中,文本特征提取由多层感知机和长短期记忆网络协作实现。在具备挑战性的公开数据集RWTH-2014、RWTH-2014T、CSL-Daily上进行实验,结果表明所提方法达到目前具有竞争力的性能。上述实验验证了所提的采用多尺度的方式可以捕捉不同时序长度的手语动作,以及构建跨模态对齐约束的思路是正确且有效的,适用于弱监督条件下的连续手语识别任务。
关键词
连续
手语识别
多尺度
跨模态对齐约束
视频视觉特征
文本特征
Keywords
continuous sign language recognition
multi-scale
cross-modal alignment constraints
video visual fea-tures
text features
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中国手语识别方法及技术综述
6
作者
蒋贤维
孙计领
张艳琼
王立平
蒋小艳
韩雪
机构
南京特殊教育师范学院数学与信息科学学院
出处
《现代特殊教育》
2024年第6期47-58,共12页
基金
国家社会科学基金年度项目“残疾人融合发展评价及提升路径研究”(20BRK029)研究成果
文摘
中国手语具有自己独特的文化内涵和复杂表达,是近3000万听障人士融入社会的重要手段。手语识别技术能帮助听障人士走出信息孤岛,和健听人建立有效沟通。中国手语识别方法大致经历了传统技术识别和现代智能识别两个时期。前者主要包含数据收集、预处理、特征提取和分类识别四个主要阶段,主流技术有HMMs、SVM和DTW等,基于手语手形数据完成识别,不依赖海量样本数据;后者主要利用深度神经网络和人工智能技术,强调深度学习,迁移学习和技术融合,模型对样本数据量的依赖程度较高。我国已经开始广泛建设各类手语语料库,但需要进一步规范和推广。
关键词
手语识别
技术
语料库
深度神经网络
迁移学习
Keywords
sign language recognition technologies
corpus,deep neural network,transfer learning
分类号
G760 [文化科学—特殊教育学]
下载PDF
职称材料
题名
基于X-CUBE-AI的神经网络手语识别系统设计
7
作者
牛帅
宗诗怡
胡威
许彬
董振华
机构
金陵科技学院电子信息工程学院
东南大学成贤学院经济管理学院
出处
《工业控制计算机》
2024年第3期21-23,共3页
文摘
手语交流是聋哑人与他人交流的主要方法,设计了一款基于STM32的神经网络手语识别系统,采用TensorFlow和Keras机器学习框架训练网络模型,由于训练数据的局限性,加入L2正则化以解决训练过拟合问题。使用意法半导体推出的STM32Cube.AI工具包在STM32嵌入式平台上部署神经网络,搭载OV2640摄像头采集图像并进行缩放处理,将图像数据传入网络进行推理可获得识别结果。经测试,网络模型获得了较好的鲁棒性和适应性,在STM32上运行平均每帧推理时间为15.8 ms,平均准确率达92.3%。使用STM32作为手语识别终端,极大地提高了设备的便携性,节约成本,反应迅速。为聋哑人与正常人交流提供了一种新的解决方案,具有较高的实际应用价值。
关键词
手语识别
X-CUBE-AI
过拟合
神经网络
L2正则化
STM32
图像
识别
Keywords
sign language recognition
X-CUBE-AI
overfitting
neural network
L2 regularization
STM32
image recognition
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于改进的YOLOv5s结构的手语识别设计
8
作者
潘丽
机构
芜湖职业技术学院电气与自动化学院
出处
《西昌学院学报(自然科学版)》
2024年第2期49-55,61,共8页
基金
安徽省高校自然科学研究重点项目(2023AH052386)
芜湖职业技术学院2023年度校级“教学质量与教学改革工程”项目(2023xxkc05、2023sczfk02)。
文摘
听力障碍者需要通过手语等方式才能进行沟通交流,但是大部分听力正常的群众不会解读手语。为解决该问题,创建了手语数据集,并提出一种基于YOLOv5改进的手语识别模型。该模型采用轻量级网络结构MobileNetV3替换了YOLOv5目标检测算法的骨干网络,取得了很好的效果。经过测试,改进后的模型在手语识别数据集中检测平均精度均值(mAP)达到98.5%,召回率(Recall)为0.92,F1(F1 score)分数为0.929。研究提出的模型在提高训练速度、减少参数量的同时,提高了手语识别的精度,满足实际检测需求。
关键词
YOLOv5
MobileNetV3
手语识别
Keywords
YOLOv5s
MobileNetV3
sign language recognition
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于关键帧和注意力残差网络的手语识别
被引量:
3
9
作者
刘群坡
盛月琴
高如新
卜旭辉
机构
河南理工大学电气工程与自动化学院
河南省智能装备直驱技术与控制国际联合实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第12期224-230,242,共8页
基金
国家自然科学基金(62273133)
河南省高校科技创新团队项目(20IRTSTHN019)
河南省科技攻关项目(212102210508)。
文摘
手语识别研究对于改善聋哑人生活质量具有重要意义,同时可促进人机交互领域的发展。针对手语视频中存在大量的无关帧、手语识别过程中手部细节信息提取不足、难以精确定位手语动作的位置和时间信息导致识别率不高等问题,提出一种基于关键帧和交互式注意力残差网络的手语识别方法。在数据预处理部分,设计基于图像相似度和模糊程度的关键帧提取算法,从基于Farneback光流法获取的大量候选关键帧中确定最终的关键帧,减少无关冗余信息。在网络部分,以3D-ResNet为基础框架,构建小卷积模块增强网络对手语视频中细粒度特征的提取能力,设计在捷径分支中采用池化卷积下采样方式的残差结构减小特征图失真程度,建立融合通道注意力和空间注意力的交互式四重注意力模块强化对目标区域关键特征的提取。实验结果表明,该方法在CSL和DEVISIGN数据集上取得了92.0%和92.2%的准确率,优于其他手语识别方法。
关键词
手语识别
关键帧
残差网络
空间注意力
通道注意力
Keywords
sign language recognition
keyframe
residual network
spatial attention
channel attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于无线传感技术与卷积神经网络的静态手语识别方法
被引量:
2
10
作者
吕军
强彦
机构
吕梁学院计算机科学与技术系
太原理工大学计算机科学与技术学院
出处
《传感技术学报》
CAS
CSCD
北大核心
2023年第4期623-628,共6页
基金
虚拟现实技术与系统国家重点实验室开放基金项目(BUAA-VR-17KF-14)
虚拟现实技术与系统国家重点实验室开放基金(VRLAB2018A08)。
文摘
基于传感网络的手语识别随着手势复杂程度的提升,识别的难度增大,因此,为了获取更加精准的静态手语识别结果,提出了基于无线传感技术与卷积神经网络的静态手语识别方法。通过无线传感技术对静态手语图像进行滤波处理,采用特征提取方法提取静态手语特征并进行融合处理,将融合后的连续二维特征图像直接转换为一维向量,将其作为卷积神经网络的输入,通过迭代训练完成静态手语识别。实验结果表明,所提方法在不同场景下静态手语识别精度高于94.11%,且识别速度较快,由此验证了所提方法可以快速准确完成静态手语识别。
关键词
无线传感技术
卷积神经网络
静态
手语
图像滤波
手语识别
Keywords
wireless sensor technology
convolutional neural network
static sign language
image filtering
gesture recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于身体姿态关键点检测及算法融合的连续手语识别
11
作者
陈雅茜
吴非
赵丁皓
机构
西南民族大学计算机科学与工程学院
出处
《西南民族大学学报(自然科学版)》
CAS
2023年第2期165-172,共8页
基金
“四川省科技计划资助”(2019YFH0055)
四川省2021-2023年高等教育人才培养质量和教学改革项目(JG2021-401)。
文摘
连续手语识别相对于单个手语词识别来说,更加具有研究意义也更加具有研究难度.连续手语识别需要更关注整体语句在时间上的依赖关系,以及语句中手语词结束与开始的时序分割问题.而对此的单个识别算法的研究与优化,短时间都很难再有较大的突破.因此,我们提出一种基于算法融合的连续手语识别方法,先通过帧间差分法处理关键帧,再通过MediaPipe检测并保存关键点数据,降低数据量,并提供有效、直接的数据;再通过CNN+BLSTM算法融合模型,让CNN专注局部感知,捕捉空间特征关系;BLSTM则侧重特征序列的时序建模,突出连续手语在时间纬度上的依赖关系.最后结合CTC完成标签和语句对齐问题.该算法在CSL数据集上取得了98.4%的平均识别率.
关键词
连续
手语识别
深度学习
CNN
BLSTM
身体姿态
Keywords
continuous sign language recognition
deep learning
CNN
BLSTM
body pose
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于视频的中文连续手语识别算法
被引量:
1
12
作者
刘诗瑶
张忠民
机构
哈尔滨工程大学信息与通信工程学院
出处
《应用科技》
CAS
2023年第3期44-49,共6页
文摘
连续手语识别是将视频序列转为符号序列的典型的弱监督问题,它只提供了句子级标签,没有提供有时间边界的帧级标签。为了克服这一问题,就需要使用连接时态分类(connectionist temporal classification,CTC),这也是目前应用最广泛的方法。实验在特征提取阶段引入时间-空间注意力机制,并增加辅助对齐模块,利用聚合交叉熵(agregation cross-entropy,ACE)散度损失对特征提取部分进行训练。该模型采用端到端方式,结合ACE散度进行片段级特征学习和CTC进行全局序列特征学习的联合训练,此外,提出的随机掉帧机制还可以进一步缓解过拟合问题。在中文手语数据集CSLR上验证了改进方法的有效性,在验证集上获得了6.9%错误率,在测试集上获得了4.3%错误率。
关键词
连续
手语识别
注意力机制
时间-空间注意力机制
连接时态分类
联合训练
弱监督
跨模态
深度学习
Keywords
continuous sign language recognition
attentional mechanism
convolutional block attention module
connectionist temporal classification
joint training
weak supervision
cross modal
deep learning
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
长短时记忆脉冲神经网络手语识别模型
13
作者
冯一飞
王青山
机构
合肥工业大学数学学院
出处
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2023年第11期1479-1483,1541,共6页
基金
中国残联残疾人辅助器具专项研究课题资助项目(CJFJRRB19-2020)。
文摘
手语识别是人机交互领域中的重要问题之一。随着人工智能技术的发展,越来越多的机器学习和深度学习方法被应用在手语识别任务上。文章设计一种轻量级的长短时记忆脉冲神经网络(long short-term memory-spiking neural network,LSTM-SNN)手语识别模型用于识别常用手语。首先提出自适应脉冲编码,将手语信号转化为脉冲信号;接着将脉冲信号输入到改进的带泄漏整合发放(leaky integrate-and-fire,LIF)神经元模型,以时间驱动的方式进行信息传导,完成网络训练。在收集到的101个手语手势数据集上的实验结果表明,该模型准确率达到95.37%,表明该文提出的模型优于其他深度学习和机器学习模型。
关键词
深度学习
模式
识别
长短时记忆网络(LSTM)
脉冲神经网络(SNN)
手语识别
Keywords
deep learning
pattern recognition
long short-term memory(LSTM)
spiking neural network(SNN)
sign language recognition
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于SlowFast网络的孤立词手语识别算法研究
被引量:
1
14
作者
黄同愿
谭禹
朱金江
机构
重庆理工大学两江人工智能学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2023年第12期267-275,共9页
基金
重庆市自然科学基金项目(cstc2021jcyj-msxmX0605)
重庆市教育委员会科学技术研究项目(KJQN202001137)。
文摘
由于运动模糊、信息冗余以及不同人手语风格多样化等原因,目前的孤立词手语识别在识别精度、背景抗干扰性和识别速度等方面仍存在不足。为此,提出了一种新的手语识别方法——基于SlowFast网络和增强手部注意力的方法(EAH-SlowFast),其使用YOLOv5和DeepSort检测并追踪手部,提高对手部信息的关注度;在骨干网络中使用Focal损失函数增加模型的分类能力;改进了SlowFast网络结构并引入通道空间注意力机制,从而提高手部信息的权重并抑制背景噪声的干扰。此外,还提出了一种关键帧提取算法,可以在一定精度的损失下大大提高效率。经实验证实,EAH-SlowFast在DEVISIGN-D数据集上的Top-5准确率达到了97.79%,优于其他先进的手语识别算法。
关键词
孤立词
手语识别
注意力机制
SlowFast
关键帧提取
Keywords
isolated word sign language recognition
attention mechanism
SlowFast
keyframes extraction
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
面向智慧博物馆的基于毫米波雷达稳健的手语识别
15
作者
赵学荣
王旋
刘彤
郑霞
江翼成
机构
西北大学信息科学与技术学院
浙江大学艺术与考古学院
出处
《电信科学》
2023年第8期109-117,共9页
基金
国家重点研发计划项目(No.2019YFC1521105)。
文摘
智慧博物馆是利用物联网、人工智能等设备或技术,构建人、物、空间信息交互通道的博物馆新形态。手语识别技术既能让听障语障观众无障碍参观博物馆,也有助于解析观众自然状态下的手势互动。然而,基于摄像头或可穿戴设备的方法在博物馆中可能有隐私安全或使用不便等问题。提出一种基于毫米波雷达稳健的手语识别方法,首先提取不同手势相对于雷达距离和速度随时间变化的特征,其次采用基于物理意义的增强处理,最后设计残差网络进一步剔除两种特征预处理后的与环境相关信息,对其进行特征融合并实现分类。实验表明,该方法可以有效识别手语,在测试环境和用户位置改变时也能达到平均90%以上的精度,为智慧博物馆的手语手势识别提供了一种新方法。
关键词
手语识别
毫米波雷达
残差网络
智慧博物馆
Keywords
sign language recognition
millimeter-wave radar
ResNet
smart museum
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于残差时移模块和双流网络的手语识别方法
16
作者
蔡畅
林靖宇
机构
广西大学电气工程学院
出处
《计算机与数字工程》
2023年第12期2841-2845,2851,共6页
基金
国家自然科学基金项目(编号:61561005)
广西研究生教育创新计划(编号:YCSW2019026)资助。
文摘
目前存在的手语识别方法中,多模态图像被广泛使用,但多模态数据形式复杂,不易操作。此外,现存的手语识别方法无法有效聚合全局与运动区域局部信息。基于改善手语识别方法的目的,论文提出了一种仅使用RGB图像的基于残差时移模块与双流网络的手语识别方法。双流网络两分支改进为全局图像分支与运动区域局部分支,运动区域局部分支采用语义分割算法进行运动区域分割,解决了以往运动区域难以定位的问题。两分支通过数据融合将全局与局部信息有效聚合。在SLR500开源数据集上进行实验,该方法获得高达94.7%的识别率。
关键词
手语识别
双流网络
时域位移
全局特征
运动区域局部分割
数据融合
Keywords
sign language recognition
two-stream networks
temporal shift
global feature
local semantic segmentation of moving region
data fusion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于智能眼镜的手语识别系统设计
被引量:
1
17
作者
刘又瑜
谢本齐
江焕
姜林
机构
湖南工商大学计算机学院
湖南工商大学前沿交叉学院
出处
《电脑知识与技术》
2023年第4期18-20,共3页
基金
国家级大学生创新创业训练计划(202110554011)。
文摘
手语识别对于听障人士交流具有重要的意义。现有机器视觉手语识别系统存在因移动设备端算力不足,各框架兼容条件苛刻影响实时应用的问题。针对该问题,本文提出基于智能眼镜硬件平台和云端计算的实时手语识别系统。该系统采用智能眼镜捕获手语动作,并将该视频图片上传至云端服务器,利用部署在云端服务器上的深度学习模型对手语进行识别,最后将识别结果返回至智能眼镜。本系统深度学习识别网络采用TSN和LSTM相结合的方式,利用TSN视频动作分类能力和LSTM上下文信息建模能力准确识别手语动作。试验结果表明,本系统实时识别精度可达到95.37%,对于听障人士实时交流具有较好的应用价值。
关键词
智能眼镜
云服务
手语识别
听障人士
智能系统
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于混合注意力机制的中文孤立词手语识别
18
作者
陈晓燚
杨波
余辉
黄国航
机构
中南民族大学计算机科学学院
出处
《信息技术与信息化》
2023年第10期194-199,共6页
文摘
手语识别技术能帮助听障人士与健听人士进行交流。当前,随着社会的快速发展,深度学习技术也为手语识别工作提供了一定的技术支持。然而在手语识别任务中,使用传统的卷积神经网络对手语视频进行时空特征的提取时,存在特征提取不充分而导致识别率低的问题。除此之外,由于手语视频中因背景光照、表演者体态不一致等问题也会影响到网络模型的识别效果。为解决上述问题,使用了一种基于混合注意力机制的手语识别模型,所提及的模型通过添加混合注意力机制的方式,用于增强对手语动作中重要区域的关注,并使用空间变换网络来增强模型的空间不变性,最终在SLR手语词数据集上完成实验验证。实验结果表明,所提及的模型准确率优于3DCNN、CNN结合LSTM等主流模型,能够有效提取手语视频中的时空特征,并提高对手语动作的识别能力。
关键词
深度学习
注意力机制
手语识别
残差网络
长短记忆神经网络
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于SRN/HMM的非特定人连续手语识别系统
被引量:
8
19
作者
方高林
高文
陈熙霖
王春立
马继勇
机构
哈尔滨工业大学计算机科学与工程系
大连理工大学计算机科学与工程系
中国科学院计算技术研究所
出处
《软件学报》
EI
CSCD
北大核心
2002年第11期2169-2175,共7页
基金
国家自然科学基金资助项目(69789301)
国家863高科技发展计划资助项目(863-306-ZD03-01-2)
中国科学院百人计划资助项目~~
文摘
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径.实验结果表明,该方法的识别效果比单纯使用HMM要好.
关键词
SRN
HMM
非特定人连续
手语识别
系统
神经网络
精简循环网络
隐马可夫规模
连续
手语识别
计算机
模式
识别
Keywords
neural network
simple recurrent network
hidden Markov model
continuous sign language recognition
signer-independent sign language recognition
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于机器学习的手语识别系统研究与开发
20
作者
尹昱杰
王启源
裴中正
施浩男
刘顺意
机构
北京信息科技大学
出处
《信息与电脑》
2023年第7期198-201,共4页
基金
北京信息科技大学大学生创新创业训练计划项目(项目编号:5112210832)。
文摘
随着机器学习和计算机视觉领域的发展,计算机已经具有分析视频内容的能力。听障人士的交流困难主要是难以理解手语动作的含义,而借助计算机分析手语视频将其转化为文字,则可以解决以上交流难题。因此,提出基于机器学习的手语识别系统,先建立手语视频数据集,借助飞桨AI Studio平台使用时间分段网络(Temporal Segments Networks,TSN)算法框架进行相应的模型训练,再对手语视频进行抽帧,分析图像内容并对其进行预测,最后输出预测结果,从而实现对手语视频的文字转译。
关键词
机器学习
手语识别
时间分段网络(TSN)
模型训练
Keywords
machine learning
sign language recognition
Temporal Segments Networks(TSN)
model training
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
改进YOLOv7-tiny的手语识别算法研究
韩晓冰
胡其胜
赵小飞
秋强
《现代电子技术》
北大核心
2024
2
下载PDF
职称材料
2
基于图神经网络和潜在空间的连续手语识别方法
邵俊倩
王铁滨
《绥化学院学报》
2024
0
下载PDF
职称材料
3
基于手语表达内容与表达特征的手语识别技术综述
陶唐飞
刘天宇
《电子与信息学报》
EI
CSCD
北大核心
2023
2
下载PDF
职称材料
4
模块化连续手语识别算法及技术综述
孟巾凯
彭健钧
肖智东
郭立
金凯
郑彤
《小型微型计算机系统》
CSCD
北大核心
2024
0
下载PDF
职称材料
5
多尺度视觉特征提取及跨模态对齐的连续手语识别
郭乐铭
薛万利
袁甜甜
《计算机科学与探索》
CSCD
北大核心
2024
0
下载PDF
职称材料
6
中国手语识别方法及技术综述
蒋贤维
孙计领
张艳琼
王立平
蒋小艳
韩雪
《现代特殊教育》
2024
0
下载PDF
职称材料
7
基于X-CUBE-AI的神经网络手语识别系统设计
牛帅
宗诗怡
胡威
许彬
董振华
《工业控制计算机》
2024
0
下载PDF
职称材料
8
基于改进的YOLOv5s结构的手语识别设计
潘丽
《西昌学院学报(自然科学版)》
2024
0
下载PDF
职称材料
9
基于关键帧和注意力残差网络的手语识别
刘群坡
盛月琴
高如新
卜旭辉
《计算机工程》
CAS
CSCD
北大核心
2023
3
下载PDF
职称材料
10
基于无线传感技术与卷积神经网络的静态手语识别方法
吕军
强彦
《传感技术学报》
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
11
基于身体姿态关键点检测及算法融合的连续手语识别
陈雅茜
吴非
赵丁皓
《西南民族大学学报(自然科学版)》
CAS
2023
0
下载PDF
职称材料
12
基于视频的中文连续手语识别算法
刘诗瑶
张忠民
《应用科技》
CAS
2023
1
下载PDF
职称材料
13
长短时记忆脉冲神经网络手语识别模型
冯一飞
王青山
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2023
0
下载PDF
职称材料
14
基于SlowFast网络的孤立词手语识别算法研究
黄同愿
谭禹
朱金江
《重庆理工大学学报(自然科学)》
CAS
北大核心
2023
1
下载PDF
职称材料
15
面向智慧博物馆的基于毫米波雷达稳健的手语识别
赵学荣
王旋
刘彤
郑霞
江翼成
《电信科学》
2023
0
下载PDF
职称材料
16
基于残差时移模块和双流网络的手语识别方法
蔡畅
林靖宇
《计算机与数字工程》
2023
0
下载PDF
职称材料
17
基于智能眼镜的手语识别系统设计
刘又瑜
谢本齐
江焕
姜林
《电脑知识与技术》
2023
1
下载PDF
职称材料
18
基于混合注意力机制的中文孤立词手语识别
陈晓燚
杨波
余辉
黄国航
《信息技术与信息化》
2023
0
下载PDF
职称材料
19
基于SRN/HMM的非特定人连续手语识别系统
方高林
高文
陈熙霖
王春立
马继勇
《软件学报》
EI
CSCD
北大核心
2002
8
下载PDF
职称材料
20
基于机器学习的手语识别系统研究与开发
尹昱杰
王启源
裴中正
施浩男
刘顺意
《信息与电脑》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
10
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部