期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于ST-AGCN算法的物流暴力分拣识别模型
1
作者 曹菁菁 余宙 +3 位作者 李鹏飞 闵艳萍 黄齐贤 赵强伟 《交通信息与安全》 CSCD 北大核心 2023年第5期115-126,共12页
目前快递物流行业普遍存在分拣人员暴力分拣现象,为减少此类行为可采用基于图像的行为识别方法,但这种方法在实际场景中存在算法鲁棒性差、人体关节点数据难获取等问题。针对上述问题,制作了1个物流暴力分拣行为视频数据集,研究了暴力... 目前快递物流行业普遍存在分拣人员暴力分拣现象,为减少此类行为可采用基于图像的行为识别方法,但这种方法在实际场景中存在算法鲁棒性差、人体关节点数据难获取等问题。针对上述问题,制作了1个物流暴力分拣行为视频数据集,研究了暴力分拣行为识别模型。通过树莓派采集室内外2种情景下的分拣视频数据,利用Python socket模块实现视频图像实时传输,采用切片筛选规则除去非标准数据,应用OpenPose模型获取关节点数据。针对一般人体行为识别网络模型无法较好反映暴力分拣关节点对动作重要影响程度的问题,研究了以ST-GCN为主干网络的优化图神经网络模型ST-AGCN。利用空间注意力机制学习不同关节点对于各种动作的影响,以更新各关节点的权重;通过增加自适应图结构层以端到端学习方式将人体骨骼图的拓扑结构与网络参数共同优化,突出关联度高的关节点对动作识别的影响。以室内外环境下暴力分拣视频为对象开展和多种深度学习模型的对比实验和消融实验,实验结果表明:ST-AGCN模型识别现实场景中暴力分拣行为的准确率相比ST-GCN、STA-LSTM、不含空间注意力机制的ST-AGCN和不含自适应图结构层的ST-AGCN模型分别提高了5.6%,13.82%,2.36%,1.61%,且适用于室内外环境杂乱、局部遮挡等复杂的物流分拣场景,验证了ST-AGCN的优越性以及空间注意力机制和自适应图结构层的有效性。 展开更多
关键词 智能物流 暴力分拣 时空图卷积网络模型 自适应图结构层 人体行为识别
下载PDF
基于空时相关性的基本单元层码率控制方案
2
作者 李伟 门佳 《计算机与现代化》 2013年第9期126-129,共4页
针对H.264/AVC视频压缩标准的JVT-H017提案改进了基本单元层码率控制方法,为获得精确的量化参数,提出一种新式的预测模型,充分利用视频信源的空时相关性特征,用一个时域空域三维相关模型代替线性模型来预测基本单元的平均绝对差值,并且... 针对H.264/AVC视频压缩标准的JVT-H017提案改进了基本单元层码率控制方法,为获得精确的量化参数,提出一种新式的预测模型,充分利用视频信源的空时相关性特征,用一个时域空域三维相关模型代替线性模型来预测基本单元的平均绝对差值,并且根据同一基本单元内各宏块图像复杂度差异自适应地调整量化参数。实验结果表明,改进后的算法避免参数更新过程以减少计算量,能改善视频编码质量,提高输出码率的控制精度。 展开更多
关键词 码率控制 基本单元层 空时相关性 自适应目标比特分配
下载PDF
基于先验梅尔谱和神经声码器的语音丢包隐藏方法
3
作者 黄晋维 鲍长春 周静 《电子学报》 EI CAS 2024年第8期2581-2590,共10页
对基于神经网络的丢包隐藏方法而言,输入特征是直接影响最终恢复效果的重要因素.此外,如何通过丢包隐藏恢复高自然度的语音,也是亟待解决的难题.为有效恢复丢包语音并提高自然度,本文提出了一种基于先验梅尔谱和神经声码器的语音丢包隐... 对基于神经网络的丢包隐藏方法而言,输入特征是直接影响最终恢复效果的重要因素.此外,如何通过丢包隐藏恢复高自然度的语音,也是亟待解决的难题.为有效恢复丢包语音并提高自然度,本文提出了一种基于先验梅尔谱和神经声码器的语音丢包隐藏方法.该方法采用一种非对称的编解码网络结构.在编码端,用两个独立的编码网络分别从时域波形和梅尔谱中提取深层时频特征.在解码端,将时频深层特征一同送入由时序自适应反归一化层构成的声码器中,以恢复丢失的语音信号并提高自然度.仿真实验表明,该方法在语音感知质量和短时客观可懂度上均优于现有的两种丢包隐藏算法. 展开更多
关键词 丢包隐藏 先验梅尔谱 神经声码器 时序自适应反归一化层 时频特征
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部