期刊文献+
共找到132篇文章
< 1 2 7 >
每页显示 20 50 100
AN EFFECTIVE LVQ-BASED ALGORITHMFOR ROBUST SPEECH RECOGNITION
1
作者 朱策 关存太 +1 位作者 厉大华 何振亚 《Journal of Southeast University(English Edition)》 EI CAS 1994年第1期9-12,共4页
Dynamic time warping (DTW) and dynamic spectral wafliing (DSW)techniques are introduced into learning vector quantization (LVQ) algorithm to con-struct a “dynamic” Bayes classifier for speech recognition. It can pre... Dynamic time warping (DTW) and dynamic spectral wafliing (DSW)techniques are introduced into learning vector quantization (LVQ) algorithm to con-struct a “dynamic” Bayes classifier for speech recognition. It can preduce highly dis-criminiative “dynamic” reference vectors to represent the temporal and spectral vari-abilities of speech. Recognition experiments on 19 Chinese consonants show that the“dynamic” classifier outperforms the original “static” classifier significantly. 展开更多
关键词 SPEECH recognition neural networks algorithms/learning vectorquantization dynamic time WARPING dynamic spectral WARPING
下载PDF
基于工况识别的P2.5构型PHEV能量管理策略
2
作者 罗勇 李豪 +3 位作者 翁勇永 李莉莎 李小凡 孙强 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第8期74-83,共10页
合适的能量管理策略能够有效提升混合动力汽车续驶里程,通过Matlab/Simulink搭建整车模型,对P2.5构型的双动力源插电式混合动力汽车(PHEV)工况识别的能量管理策略展开研究。选取19个国内外典型循环工况,根据工况特征用层次聚类分析法将... 合适的能量管理策略能够有效提升混合动力汽车续驶里程,通过Matlab/Simulink搭建整车模型,对P2.5构型的双动力源插电式混合动力汽车(PHEV)工况识别的能量管理策略展开研究。选取19个国内外典型循环工况,根据工况特征用层次聚类分析法将其划分为3类,建立支持向量机工况识别模型,采用鲸鱼算法对其进行优化,仿真结果表明,优化后工况识别模型识别准确率可达97.905%,与优化前相比,提高了21.646%。结合在线工况识别模型,通过神经网络学习不同工况类别下动态规划能量管理策略的功率分配结果,将离线学习结果应用于在线控制中,制定基于工况识别的能量管理策略。仿真结果显示,与电量消耗-电量维持(CD-CS)策略相比,基于工况识别的能量管理策略经济性提升了7.62%。 展开更多
关键词 插电式混合动力汽车 能量管理策略 工况识别 动态规划 神经网络
下载PDF
基于多维投影时空事件帧的动态视觉传感手势识别
3
作者 康来 张亚坤 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期649-658,共10页
基于视觉的手势识别是虚拟现实、游戏仿真等领域常用的人机交互手段。在实际应用中,手势动作快速变化将导致传统RGB相机或深度相机成像模糊,给手势识别带来巨大挑战。针对上述问题,利用动态视觉传感器捕捉高速手势运动信息,提出一种基... 基于视觉的手势识别是虚拟现实、游戏仿真等领域常用的人机交互手段。在实际应用中,手势动作快速变化将导致传统RGB相机或深度相机成像模糊,给手势识别带来巨大挑战。针对上述问题,利用动态视觉传感器捕捉高速手势运动信息,提出一种基于多维投影时空事件帧(spatiotemporal event frame,STEF)的动态视觉数据手势识别方法。将时空信息嵌入到数据投影面融合形成多维投影时空事件帧,克服现有动态视觉信息事件帧表达方法时域信息丢失的局限性,提升动态视觉传感数据的特征表达能力。在此基础上,采用先进的脉冲神经网络对时空事件帧进行分类实现手势识别。在公开数据集上的识别精度达到96.67%,性能优于同类方法,表明该方法可显著提升动态视觉传感数据手势识别准确率。 展开更多
关键词 动态视觉传感器 手势识别 多维投影 时空事件帧 脉冲神经网络
下载PDF
基于视觉的神经网络三维动态手势识别方法综述 被引量:1
4
作者 王瑞平 吴士泓 +1 位作者 张美航 王小平 《计算机科学》 CSCD 北大核心 2024年第4期193-208,共16页
动态手势识别作为一种重要的人机交互手段而受到广泛关注,其中基于视觉的识别方式因其使用便利性和低成本的优势成为新一代人机交互的首选技术。以人工神经网络为中心,综述了基于视觉的手势识别方法研究进展,分析了不同类型人工神经网... 动态手势识别作为一种重要的人机交互手段而受到广泛关注,其中基于视觉的识别方式因其使用便利性和低成本的优势成为新一代人机交互的首选技术。以人工神经网络为中心,综述了基于视觉的手势识别方法研究进展,分析了不同类型人工神经网络在手势识别中的发展现状,调研并归纳总结了待识别数据和训练数据集的类型及特点;此外,通过开展性能对比实验,客观评估了不同类型的人工神经网络,并对结果进行了分析。最后,对调研内容进行了总结,对该领域面临的挑战和存在的问题进行了阐述,对动态手势识别技术的发展趋势进行了展望。 展开更多
关键词 动态手势识别 人机交互 人工神经网络 卷积神经网络 循环神经网络 注意力机制 混合神经网络
下载PDF
融合三维人脸动态信息和光流信息的人脸表情识别
5
作者 张华忠 潘曰凯 +3 位作者 涂晓光 刘建华 许罗鹏 周超 《计算机科学》 CSCD 北大核心 2024年第S01期594-600,共7页
人脸表情识别在静态图像上取得了卓越的成效,但这些方法应用于视频或图像序列时,准确度和鲁棒性往往会受到影响。传统的方法通常无法基于空间信息和光流信息进行人脸表情的识别,然而这些辅助识别信息都是二维信息,没有考虑到人脸的表情... 人脸表情识别在静态图像上取得了卓越的成效,但这些方法应用于视频或图像序列时,准确度和鲁棒性往往会受到影响。传统的方法通常无法基于空间信息和光流信息进行人脸表情的识别,然而这些辅助识别信息都是二维信息,没有考虑到人脸的表情变化是一种三维的变化过程。为充分挖掘人脸表情识别的深层语义信息,提出了一种基于三维人脸动态信息和光流信息相结合的融合表情识别方法。该方法构建基于人脸深度图像、光流图像和RGB图像的多流卷积神经网络,通过融合3种模态的信息进行人脸表情识别。所提方法在CAER,RAVDESS数据集上进行了充分验证,实验结果表明,其在表情识别性能上优于目前的主流方法,证明了其有效性。 展开更多
关键词 表情识别 多流卷积神经网络 三维人脸动态信息 光流信息
下载PDF
一种动态自适应麻雀搜索算法及在车联网驾驶行为识别中的应用
6
作者 涂友斌 阚欣宇 +1 位作者 王岩 邓志祥 《现代电子技术》 北大核心 2024年第23期147-153,共7页
针对麻雀搜索算法(SSA)跟随者接近种群内个体最佳位置时收敛速度过快而导致易陷入局部最优的问题,文中提出一种基于动态自适应的改进型麻雀搜索算法(ASSA)。首先,在搜索寻优过程中,对发现者位置和跟随者位置进行动态更新,为保证算法在... 针对麻雀搜索算法(SSA)跟随者接近种群内个体最佳位置时收敛速度过快而导致易陷入局部最优的问题,文中提出一种基于动态自适应的改进型麻雀搜索算法(ASSA)。首先,在搜索寻优过程中,对发现者位置和跟随者位置进行动态更新,为保证算法在迭代后期的收敛速度,警戒者的个数采用线性递减的方式;其次,为防止算法陷入局部最优而导致的迭代中断,通过高斯随机分布形成新的发现者;最后,为验证改进算法的有效性,利用4种典型的函数进行测试,测试结果与SSA进行对比。结果表明:ASSA能够有效解决SSA易陷入局部最优的问题,并在收敛速度等性能上得到了有效提升。在此基础上,将ASSA算法应用到车联网驾驶行为识别中,通过优化BP神经网络,使得网络具有更高的识别准确率和性能。 展开更多
关键词 麻雀搜索算法 动态自适应 BP神经网络 驾驶行为识别 车联网 高斯随机分布
下载PDF
用于训练神经网络的自适应梯度下降优化算法 被引量:3
7
作者 阮乐笑 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第1期25-31,共7页
由于神经网络规模的扩大,模型训练变得越来越困难.为应对这一问题,提出了一种新的自适应优化算法——Adaboundinject.选取Adam的改进算法Adabound算法,引入动态学习率边界,实现了自适应算法向随机梯度下降(SGD)的平稳过渡.为了避免最小... 由于神经网络规模的扩大,模型训练变得越来越困难.为应对这一问题,提出了一种新的自适应优化算法——Adaboundinject.选取Adam的改进算法Adabound算法,引入动态学习率边界,实现了自适应算法向随机梯度下降(SGD)的平稳过渡.为了避免最小值的超调,减少在最小值附近的振荡,在Adabound的二阶矩中加入一阶矩,利用短期参数更新作为权重,以控制参数更新.为了验证算法性能,在凸环境下,通过理论证明了Adaboundinject具有收敛性.在非凸环境下,进行了多组实验,采用了不同的神经网络模型,通过与其他自适应算法对比,验证了该算法相比其他优化算法具有更好的性能.实验结果表明,Adaboundinject算法在深度学习优化领域具有重要的应用价值,能够有效提高模型训练的效率和精度. 展开更多
关键词 深度学习 自适应优化算法 神经网络模型 图像识别 动态学习率边界 短期参数更新
下载PDF
基于DSConvBiGRU网络和热电堆阵列的动态手势识别方法
8
作者 顾亮 于莲芝 《计量学报》 CSCD 北大核心 2024年第6期795-805,共11页
提出了适用于嵌入式系统并融合深度可分离卷积神经网络与双向门控循环单元的DSConvBiGRU网络模型,将其用于动态手势序列的分类,设计并实现了一种使用低分辨率热电堆阵列传感器的动态手势识别解决方案,构建了动态手势数据集并在公开网站... 提出了适用于嵌入式系统并融合深度可分离卷积神经网络与双向门控循环单元的DSConvBiGRU网络模型,将其用于动态手势序列的分类,设计并实现了一种使用低分辨率热电堆阵列传感器的动态手势识别解决方案,构建了动态手势数据集并在公开网站发布,完成了预训练网络模型在Raspberry Pi边缘端的部署。系统对传感器输出的连续20个温度矩阵进行区间映射、背景减除、Lanczos插值和Otsu二值化预处理得到单个动态手势序列,再由预训练的DSConvBiGRU网络进行分类。实验结果表明:网络模型在测试集上识别准确率为99.291%,在边缘端预处理耗时5.513 ms,推理耗时8.231 ms,该系统满足低功耗、高精度和实时性的设计需求。 展开更多
关键词 机器视觉 光电检测 动态手势识别 热电堆阵列 深度可分离卷积神经网络 双向门控循环单元
下载PDF
基于动态图卷积神经网络和BiLSTM的情绪识别
9
作者 郑进港 杨俊 《陕西理工大学学报(自然科学版)》 2024年第5期67-73,82,共8页
针对情绪发生过程中电极通道间的空间依赖关系会随着时间推移而发生变化的问题,提出了一种基于动态图卷积神经网络-双向长短时记忆网络(DGCNN-BiLSTM)的模型用于情绪识别。首先,利用DGCNN通过训练神经网络动态学习不同电极通道之间的联... 针对情绪发生过程中电极通道间的空间依赖关系会随着时间推移而发生变化的问题,提出了一种基于动态图卷积神经网络-双向长短时记忆网络(DGCNN-BiLSTM)的模型用于情绪识别。首先,利用DGCNN通过训练神经网络动态学习不同电极通道之间的联系,从而动态更新优化邻接矩阵;其次,BiLSTM可以学习特征序列的前后时间相关性,从而提高网络情绪识别能力。在SEED和DEAP数据集上进行了实验,前者取得92.03%的最高平均准确率,后者在唤醒维度和效价维度实验中分别取得96.56%和95.22%的最高平均准确率。结果表明,模型有利于提升情绪识别准确率,与其他方法相比,情绪分类精度也有不同程度的提升。 展开更多
关键词 图卷积神经网络 动态图卷积神经网络 双向长短时记忆网络 情绪识别 邻接矩阵
下载PDF
基于人工神经网络的电力变压器声纹识别技术
10
作者 李瑞琪 李燕 +1 位作者 杜水婷 王军 《沈阳工业大学学报》 CAS 北大核心 2024年第4期380-387,共8页
针对变压器运行状态声纹识别的应用需求以及BP神经网络识别模型准确率较低等问题,提出了一种改进人工神经网络的变压器声纹识别技术。该技术以变压器声纹信号中的MFCC系数作为模型的输入特征向量,在BOA算法中引入动态权重因子和变异因子... 针对变压器运行状态声纹识别的应用需求以及BP神经网络识别模型准确率较低等问题,提出了一种改进人工神经网络的变压器声纹识别技术。该技术以变压器声纹信号中的MFCC系数作为模型的输入特征向量,在BOA算法中引入动态权重因子和变异因子对BP神经网络权值和阈值进行寻优,开展声纹识别。实验结果表明,利用变压器声纹信号的32维MFCC特征系数可使识别准确率达到90%以上,优化后算法的运算速度比PSO-BP神经网络与BOA-BP神经网络提高了9.24%和8.64%,具有更高的运算效率和识别准确率。 展开更多
关键词 声纹识别 BP神经网络 特征向量 权重因子 动态寻优 模式识别 变异因子 状态检测
下载PDF
基于DRNN动态整定PMSM的SVPWM控制
11
作者 胡雪峰 谭国俊 《机电工程》 CAS 2007年第6期61-64,共4页
为解决传统的永磁同步电机控制系统中存在的低速转矩脉动大以及由此引起的高频噪声、动态响应慢等问题,提出了一种基于对角神经网络动态自整定的永磁同步电机矢量控制系统的实施方案。给出了基于对角递归神经网络的PID动态自整定控制器... 为解决传统的永磁同步电机控制系统中存在的低速转矩脉动大以及由此引起的高频噪声、动态响应慢等问题,提出了一种基于对角神经网络动态自整定的永磁同步电机矢量控制系统的实施方案。给出了基于对角递归神经网络的PID动态自整定控制器的结构,以及PID参数动态自整定的学习控制算法,并将这种综合控制策略引入永磁同步电机空间电压矢量PWM控制中。仿真结果表明,系统低速性能好,转矩脉动小,谐波含量少,当电机参数改变或者受到外部扰动时,系统具有良好的动态特性。 展开更多
关键词 对角递归神经网络 动态整定 空间矢量脉宽调制 综合控制 永磁同步电机
下载PDF
基于混合神经网络的个性化自然语言情感识别系统
12
作者 韦灵 卢光云 唐爱龙 《自动化与仪表》 2024年第9期26-28,65,共4页
为在面临输入自然语言信息中存在微小变化或噪声干扰时,提升系统的鲁棒性与泛化能力,设计基于混合神经网络的个性化自然语言情感识别系统。以现场可编程门阵列为核心,设计自然语言采集模块,用于采集个性化自然语言信息;通过预处理模块,... 为在面临输入自然语言信息中存在微小变化或噪声干扰时,提升系统的鲁棒性与泛化能力,设计基于混合神经网络的个性化自然语言情感识别系统。以现场可编程门阵列为核心,设计自然语言采集模块,用于采集个性化自然语言信息;通过预处理模块,处理采集的个性化自然语言信息中的语音信息,得到对数梅尔谱图;情感识别模块利用动态卷积神经网络和长短时记忆网络,组建混合神经网络,其中,通过动态卷积神经网络,在对数梅尔谱图内提取语音信息特征,采用长短时记忆神经网络,在自然语言文本信息内提取文本信息特征,通过全连接神经网络,融合语音与文本信息特征,输出个性化情感识别结果。实验证明,该系统可有效采集个性化自然语言信息,并提取语音信息特征,完成个性化自然语言情感识别;在噪声干扰下,该系统的情感识别精度较高。 展开更多
关键词 混合神经网络 个性化 自然语言 情感识别 动态卷积 长短时记忆网络
下载PDF
基于神经网络的动态手势识别方法研究
13
作者 秦利娟 王礼云 《软件》 2024年第9期175-177,共3页
人工神经网络及计算机视觉分析技术的发展使得动态手势识别技术越来越成熟,被广泛应用于体育运动训练、机器人设计等多个领域。传统的手势识别模型需要人工提取特征,无法实现复杂特征的人工操作,导致手势识别效果不佳。深度学习在目标... 人工神经网络及计算机视觉分析技术的发展使得动态手势识别技术越来越成熟,被广泛应用于体育运动训练、机器人设计等多个领域。传统的手势识别模型需要人工提取特征,无法实现复杂特征的人工操作,导致手势识别效果不佳。深度学习在目标识别、分类任务等领域的应用越来越广泛,神经网络技术具备强大的图像特征提取能力,可获得更好的手势识别效果。本研究提出一种基于卷积神经网络的动态手势识别模型。 展开更多
关键词 卷积神经网络 动态手势 图像识别
下载PDF
基于改进YOLOv8的自然环境下柑橘果实识别
14
作者 余圣新 韦莹莹 +4 位作者 方辉 李敏 柴秀娟 曾志康 覃泽林 《湖北农业科学》 2024年第8期23-27,共5页
为实现柑橘果实的精准快速识别,提出了一种改进YOLOv8网络模型。首先将YOLOv8网络模型中的部分传统卷积替换为ODConv全维动态卷积,以增强YOLOv8网络模型在复杂的自然环境下的适应能力,然后将YOLOv8的CIoU损失函数替换为MPDIoU损失函数,... 为实现柑橘果实的精准快速识别,提出了一种改进YOLOv8网络模型。首先将YOLOv8网络模型中的部分传统卷积替换为ODConv全维动态卷积,以增强YOLOv8网络模型在复杂的自然环境下的适应能力,然后将YOLOv8的CIoU损失函数替换为MPDIoU损失函数,解决了CIoU损失函数在特殊情况下退化的问题,接着通过消融试验,分别验证了ODConv全维动态卷积与MPDIoU损失函数的有效性,改进后YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l、YOLOv8x的平均识别精度mAP分别从86.40%、88.92%、88.97%、88.99%、89.11%提高至88.25%、89.32%、89.57%、89.90%、90.12%。试验结果表明,ODConv全维动态卷积与MPDIoU损失函数能有效提高YOLOv8网络模型在自然环境下的柑橘果实识别能力。 展开更多
关键词 柑橘果实识别 卷积神经网络 YOLOv8 ODConv全维动态卷积 MPDIoU损失函数
下载PDF
基于每点动态自适应卷积的人体运动识别
15
作者 湛玉峰 《计算机应用文摘》 2024年第15期89-91,共3页
针对普通卷积计算冗余和参数量较大的问题,提出了一种每点动态自适应卷积的人体运动识别方法。通过系数生成层和固定滤波核,在输入特征图的每个相应邻域内自适应地生成卷积核,从而有效提取传感器数据的特征信息,同时避免繁重的计算、参... 针对普通卷积计算冗余和参数量较大的问题,提出了一种每点动态自适应卷积的人体运动识别方法。通过系数生成层和固定滤波核,在输入特征图的每个相应邻域内自适应地生成卷积核,从而有效提取传感器数据的特征信息,同时避免繁重的计算、参数和内存成本。实验结果表明,每点动态自适应卷积以普通卷积神经网络70%的Flops取得了1%~2%的精度提升,同时展现了更强的目标定位能力,在人体运动识别领域具有一定的优越性。 展开更多
关键词 人体运动识别 深度学习 动态卷积 传感器 卷积神经网络
下载PDF
基于人体模型约束的步态动态识别方法 被引量:4
16
作者 刘今越 李慧宇 +1 位作者 贾晓辉 李佳蕊 《计算机应用》 CSCD 北大核心 2023年第3期972-977,共6页
针对外骨骼机器人在人机交互、医疗康复中的人体运动步态准确识别问题,提出一种基于人体模型约束的步态动态识别方法。首先,利用AMS仿真软件建立不同运动的仿真模型,根据模型约束划分步态相位,并通过回归映射建立真实数据与仿真数据间... 针对外骨骼机器人在人机交互、医疗康复中的人体运动步态准确识别问题,提出一种基于人体模型约束的步态动态识别方法。首先,利用AMS仿真软件建立不同运动的仿真模型,根据模型约束划分步态相位,并通过回归映射建立真实数据与仿真数据间的对应关系;然后,将柔性压力传感器采集的足底压力数据以及惯性测量单元采集的足部位移数据融合为足部运动数据,并根据动态变化结合模型约束条件动态分割运动数据,以判断步态相位;最后,搭建卷积神经网络(CNN)识别行走步态相位。实验结果表明,所提方法的行走动作步态平均识别准确率为94.58%,上、下楼梯动作的平均步态识别准确率分别为93.21%和94.64%,与未经动态分割的足底压力数据的步态识别相比,分别提高了11.34、12.19和16.03个百分点。可见,通过经动态分割的足部运动数据进行CNN识别具有较高的准确率,且适用于不同动作的步态识别。 展开更多
关键词 步态识别 动态检测 人体模型 卷积神经网络 足底压力
下载PDF
基于混合注意力机制的动态人脸表情识别 被引量:2
17
作者 刘希未 宫晓燕 +4 位作者 赵红霞 边思宇 邵帅 戴亚平 代文鑫 《计算机应用》 CSCD 北大核心 2023年第S01期1-7,共7页
针对自然环境中存在人脸遮挡、姿势变化等复杂因素,以及卷积神经网络(CNN)中的卷积滤波器由于空间局部性无法学习大多数神经层中不同面部区域之间的长程归纳偏差的问题,提出一种用于动态人脸表情识别(DFER)的混合注意力机制模型(HA-Mode... 针对自然环境中存在人脸遮挡、姿势变化等复杂因素,以及卷积神经网络(CNN)中的卷积滤波器由于空间局部性无法学习大多数神经层中不同面部区域之间的长程归纳偏差的问题,提出一种用于动态人脸表情识别(DFER)的混合注意力机制模型(HA-Model),以提升DFER的鲁棒性和准确性。HA-Model由空间特征提取和时序特征处理两部分组成:空间特征提取部分通过两种注意力机制——Transformer和包含卷积块注意力模块(CBAM)的网格注意力模块,引导网络从空间角度学习含有遮挡、姿势变化的鲁棒面部特征并关注人脸局部显著特征;时序特征处理部分通过Transformer引导网络学习高层语义特征的时序联系,用于学习人脸表情特征的全局表示。实验结果表明,HA-Model在DFEW和AFEW基准上的准确率分别达到了67.27%和50.41%,验证了HA-Model可以有效提取人脸特征并提升动态人脸表情识别的精度。 展开更多
关键词 动态人脸表情识别 深度学习 卷积神经网络 注意力机制 TRANSFORMER 卷积块注意力模块
下载PDF
基于矩阵型惯性投影神经网络的非负矩阵分解算法
18
作者 李小玲 夏又生 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第1期1-8,共8页
提出一种基于矩阵型神经动力学优化的非负矩阵分解算法.将矩阵非负分解优化问题首先转换为两个矩阵变量凸优化子问题,针对其子问题分别提出矩阵型惯性投影神经网络;然后,采用交替迭代方案寻找矩阵非负分解优化问题的解.理论分析证明了... 提出一种基于矩阵型神经动力学优化的非负矩阵分解算法.将矩阵非负分解优化问题首先转换为两个矩阵变量凸优化子问题,针对其子问题分别提出矩阵型惯性投影神经网络;然后,采用交替迭代方案寻找矩阵非负分解优化问题的解.理论分析证明了矩阵型惯性投影神经网络能收敛于矩阵变量凸优化子问题的最优解,并且基于矩阵型神经网络的交替迭代算法可以收敛到矩阵非负分解优化问题的偏最优解.最后,所提出的基于矩阵型神经网络的交替迭代算法被有效地应用于人脸识别. 展开更多
关键词 非负矩阵分解 矩阵动力学优化 惯性投影神经网络 人脸识别
下载PDF
基于车载毫米波雷达动态手势识别网络 被引量:4
19
作者 董连飞 马志雄 朱西产 《北京理工大学学报》 EI CAS CSCD 北大核心 2023年第5期493-498,共6页
基于Transformer提出一种车载毫米波雷达手势识别方法,可用于车内人员进行人机交互.毫米波雷达信号不受车内光照变化影响,同时能够保证乘客隐私.首先,毫米波雷达采样信号经过二维傅里叶变换和滤波获得距离—多普勒(RDM)和距离—角度图(R... 基于Transformer提出一种车载毫米波雷达手势识别方法,可用于车内人员进行人机交互.毫米波雷达信号不受车内光照变化影响,同时能够保证乘客隐私.首先,毫米波雷达采样信号经过二维傅里叶变换和滤波获得距离—多普勒(RDM)和距离—角度图(RAM);然后,将连续多帧RDM和RAM经过三维卷积网络后进行特征融合与拼接得到特征向量,利用Transformer模块进行位置和序列编码;最后通过全连接层获得手势概率分布向量.采集了基于实际路况和多种干扰环境下的雷达数据制作了手势识别分类的数据集,实验结果表明该方法可以有效的检测与识别多种典型手势,识别准确率可以达到97.14%以上. 展开更多
关键词 动态手势识别 三维卷积神经网络 毫米波雷达
下载PDF
基于动态卷积递归神经网络的语音情感识别 被引量:5
20
作者 耿磊 傅洪亮 +3 位作者 陶华伟 卢远 郭歆莹 赵力 《计算机工程》 CAS CSCD 北大核心 2023年第4期125-130,137,共7页
动态情感特征是说话人独立语音情感识别中的重要特征。由于缺乏对语音中时频信息的充分挖掘,现有动态情感特征表征能力有限。为更好地提取语音中的动态情感特征,提出一种动态卷积递归神经网络语音情感识别模型。基于动态卷积理论构建一... 动态情感特征是说话人独立语音情感识别中的重要特征。由于缺乏对语音中时频信息的充分挖掘,现有动态情感特征表征能力有限。为更好地提取语音中的动态情感特征,提出一种动态卷积递归神经网络语音情感识别模型。基于动态卷积理论构建一种动态卷积神经网络提取语谱图中的全局动态情感信息,使用注意力机制分别从时间和频率维度对特征图关键情感区域进行强化表示,同时利用双向长短期记忆网络对谱图进行逐帧学习,提取动态帧级特征及情感的时序依赖关系。在此基础上,利用最大密度散度损失对齐新个体特征与训练集特征分布,降低个体差异性对特征分布产生的影响,提升模型表征能力。实验结果表明,该模型在CASIA中文情感语料库、Emo-db德文情感语料库及IEMOCAP英文情感语料库上分别取得59.50%、88.01%及66.90%的加权平均精度,相较HuWSF、CB-SER、RNN-Att等其他主流模型识别精度分别提升1.25~16.00、0.71~2.26及2.16~8.10个百分点,验证了所提模型的有效性。 展开更多
关键词 语音情感识别 特征提取 动态特征 注意力机制 神经网络
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部