在智能监控领域,实现人群计数具有重要价值,针对人群尺度不一、人群密度分布不均及遮挡等问题,提出一种多尺度多任务卷积神经网络(MMCNN)进行人群计数的方法。首先提出一种新颖的自适应人形核生成密度图描述人群信息,消除人群遮挡影响;...在智能监控领域,实现人群计数具有重要价值,针对人群尺度不一、人群密度分布不均及遮挡等问题,提出一种多尺度多任务卷积神经网络(MMCNN)进行人群计数的方法。首先提出一种新颖的自适应人形核生成密度图描述人群信息,消除人群遮挡影响;其次通过构建多尺度卷积神经网络解决人群尺度不一问题,以多任务学习机制同时估计密度图及人群密度等级,解决人群分布不均问题;最后设计一种加权损失函数,提高人群计数准确率。在UCF_CC_50和World Expo'10数据库上进行了评估,验证了自适应人形核的有效性。实验结果表明:所提算法比Sindagi等的方法 (SINDAGI V A,PATEL V M. CNN-based cascaded multi-task learning of high-level prior and density estimation for crowd counting. Proceedings of the 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance. Piscataway,NJ:IEEE,2017:1-6)在UCF_CC_50数据库上平均绝对误差(MAE)数值和均方误差(MSE)数值分别降低约1. 7和45;与Zhang等的方法(ZHANG Y,ZHOU D,CHEN S,et al. Single-image crowd counting via multi-column convolutional neural network. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Washington,DC:IEEE Computer Society,2016:589-597)相比,在World Expo'10数据库上所提算法的MAE值降低约1. 5,且在真实公共汽车数据库上仅0~3人的计数误差,表明其实用性较强。展开更多
卷积神经网络的兴起产生了大量基于视图的三维模型识别方法,不同的视图融合方式影响了网络模型的特征提取性能.本文提出了一种自适应视图融合方法,将视图的动态奇异值信息作为三维模型的特征描述符,获得三维模型全局特征的方式由区域化...卷积神经网络的兴起产生了大量基于视图的三维模型识别方法,不同的视图融合方式影响了网络模型的特征提取性能.本文提出了一种自适应视图融合方法,将视图的动态奇异值信息作为三维模型的特征描述符,获得三维模型全局特征的方式由区域化分块、自适应SVD(Singular Value Decomposition)分解和维度压缩三部分组成,通过分块后的子区域极大地关注三维模型的局部特征,并用自适应的方法判断每个局部特征的影响大小,最后维度压缩去除较小影响的数值.动态奇异值网络是将这三部分作为卷积神经网络的后端,形成一个端对端(end to end)可训练的三维模型特征提取框架.与当今先进方法相比,在ModelNet40数据集上的分类和检索结果分别提升了1. 2%和0. 8%,在ModelNet10和ModelNet40的Top-10平均检索精度分别提高了3. 7%和4%.展开更多
文摘在智能监控领域,实现人群计数具有重要价值,针对人群尺度不一、人群密度分布不均及遮挡等问题,提出一种多尺度多任务卷积神经网络(MMCNN)进行人群计数的方法。首先提出一种新颖的自适应人形核生成密度图描述人群信息,消除人群遮挡影响;其次通过构建多尺度卷积神经网络解决人群尺度不一问题,以多任务学习机制同时估计密度图及人群密度等级,解决人群分布不均问题;最后设计一种加权损失函数,提高人群计数准确率。在UCF_CC_50和World Expo'10数据库上进行了评估,验证了自适应人形核的有效性。实验结果表明:所提算法比Sindagi等的方法 (SINDAGI V A,PATEL V M. CNN-based cascaded multi-task learning of high-level prior and density estimation for crowd counting. Proceedings of the 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance. Piscataway,NJ:IEEE,2017:1-6)在UCF_CC_50数据库上平均绝对误差(MAE)数值和均方误差(MSE)数值分别降低约1. 7和45;与Zhang等的方法(ZHANG Y,ZHOU D,CHEN S,et al. Single-image crowd counting via multi-column convolutional neural network. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Washington,DC:IEEE Computer Society,2016:589-597)相比,在World Expo'10数据库上所提算法的MAE值降低约1. 5,且在真实公共汽车数据库上仅0~3人的计数误差,表明其实用性较强。
文摘卷积神经网络的兴起产生了大量基于视图的三维模型识别方法,不同的视图融合方式影响了网络模型的特征提取性能.本文提出了一种自适应视图融合方法,将视图的动态奇异值信息作为三维模型的特征描述符,获得三维模型全局特征的方式由区域化分块、自适应SVD(Singular Value Decomposition)分解和维度压缩三部分组成,通过分块后的子区域极大地关注三维模型的局部特征,并用自适应的方法判断每个局部特征的影响大小,最后维度压缩去除较小影响的数值.动态奇异值网络是将这三部分作为卷积神经网络的后端,形成一个端对端(end to end)可训练的三维模型特征提取框架.与当今先进方法相比,在ModelNet40数据集上的分类和检索结果分别提升了1. 2%和0. 8%,在ModelNet10和ModelNet40的Top-10平均检索精度分别提高了3. 7%和4%.