期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于区域渐进校准网络的人脸检测与定位
1
作者 齐向明 侯明君 +1 位作者 高鹏淇 黄胜 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2024年第2期248-256,共9页
为解决角度变化下的人脸检测中存在参数量大及角度幅度变量小的问题,提出区域渐进校准网络用于任意平面角度的人脸检测,通过级联网络结构降低角度变化、提升网络运行速度。采用区域生成网络产生高质量的候选区域,构造渐进校准网络,逐步... 为解决角度变化下的人脸检测中存在参数量大及角度幅度变量小的问题,提出区域渐进校准网络用于任意平面角度的人脸检测,通过级联网络结构降低角度变化、提升网络运行速度。采用区域生成网络产生高质量的候选区域,构造渐进校准网络,逐步缩小面部平面角度变化范围,同时由粗到细地对候选区域执行面部检测。其中,特征提取的中间层融合参数量较少时,更好地表示了面部特征,调整锚的设置解决小尺度面部问题。在角度增强的FDDB(face detection data set and benchmark)数据集与WIDER FACE数据集上的实验结果表明,提出的方法分别取得了89.1%与90.4%的平均召回率,准确度高于快速区域卷积神经网络(Faster RCNN),且运行速度更快。在实际项目中使用该算法,验证了该方法的有效性及可行性。 展开更多
关键词 人脸检测 神经网络 机器视觉 级联网络 旋转不变
下载PDF
基于ASGRU-CNN时空双通道的语音情感识别
2
作者 高鹏淇 黄鹤鸣 《计算机仿真》 2024年第4期180-186,共7页
语音情感识别是实现人机交互的关键,如何提升语音情感识别的准确率以及更有效地提取具有情感代表性的特征是语音情感识别所面临的问题之一。针对以上问题,构建了一种包含空间特征提取模块和时序特征提取模块的双通道时空语音情感识别模... 语音情感识别是实现人机交互的关键,如何提升语音情感识别的准确率以及更有效地提取具有情感代表性的特征是语音情感识别所面临的问题之一。针对以上问题,构建了一种包含空间特征提取模块和时序特征提取模块的双通道时空语音情感识别模型ASGRU-CNN。模型总体框架由两条并行分支组成:第一分支为空间特征提取模块,由三维卷积、二维卷积及池化操作共同构成级联结构;第二分支为时序特征提取模块,由切片循环神经网络内嵌门控循环单元及注意力机制构成。模型以韵律特征及谱特征的融合特征作为输入特征,经过双分支处理后,进入全连接层进行语音情感分类。在CASIA与EMO-DB数据库上进行相关实验,并通过数据扩充增加训练样本,与其它语音情感识别模型实验结果相比,所提出的模型具有较好的鲁棒性和泛化性。 展开更多
关键词 语音情感识别 融合特征 切片循环神经网络 注意力机制 数据扩充
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部