期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
改进YOLOv5的智慧课堂人脸检测算法
1
作者 钟源 袁家政 +2 位作者 李鸿天 刘宏哲 徐成 《计算机工程与应用》 CSCD 北大核心 2024年第11期251-257,共7页
智慧课堂是人工智能领域热门的应用场景。针对课堂场景下摄像头位置较远且偏,图像中目标存在人脸过小和遮挡导致漏检或错检等问题,提出了一种改进YOLOv5的智慧课堂人脸检测算法YOLOv5-SASA。该算法主要包括三个部分,在backbone层沿用了C... 智慧课堂是人工智能领域热门的应用场景。针对课堂场景下摄像头位置较远且偏,图像中目标存在人脸过小和遮挡导致漏检或错检等问题,提出了一种改进YOLOv5的智慧课堂人脸检测算法YOLOv5-SASA。该算法主要包括三个部分,在backbone层沿用了CSPDarknet53网络,通过在最后的空间池化层中使用BasicRFB模块来有效增强网络的特征提取能力;采用NWD损失函数来提高模型对小目标检测的鲁棒性,同时在head层中引入了独立自注意力机制模块SASA,以解决人脸遮挡的问题,并降低模型的参数量;通过降低中间层通道神经元的数量、调节学习率等方式,对改进的YOLOv5网络进行了优化,以避免模型过拟合。实验结果表明,所提出的方法在WiderFace验证集的easy、medium和hard难度下的效果均优于原网络,分别达到了97.5%、96.3%和86.5%的准确率,能够有效提升课堂场景下人脸检测的精度。 展开更多
关键词 智慧课堂 人脸检测 YOLOv5 独立自注意力机制
下载PDF
基于双重时空特征金字塔的人体行为识别
2
作者 李贵 袁家政 +1 位作者 刘宏哲 徐成 《传感器与微系统》 CSCD 北大核心 2024年第4期132-135,共4页
针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增... 针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增加网络对多个尺度的敏感度。第一重为语义增强金字塔(SEEP),自顶向下融合多个尺度的特征,在不同尺度的特征中传递高层语义信息;第二重为空间增强金字塔(SPEP),采用自底向上的融合方式,在不同尺度的特征中传递空间定位信息。在公共数据集AVA上的实验结果表明:该方法能获得24.97 mAP,相较于原网络提升了0.77 mAP,并有效地提升了人体行为识别的准确度,相比于同类算法更符合实际应用需求。 展开更多
关键词 神经网络 特征金字塔 多尺度融合 人体行为识别 视频理解
下载PDF
基于时空注意力图卷积网络模型的人体骨架动作识别算法 被引量:16
3
作者 李扬志 袁家政 刘宏哲 《计算机应用》 CSCD 北大核心 2021年第7期1915-1921,共7页
针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出一种基于时空注意力图卷积网络(STA-GCN)模型的人体骨架动作识别算法。该模型包含空间注意力机制和时间注意力机制:空间注意力机制一方面利用光流特征中的瞬时运动... 针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出一种基于时空注意力图卷积网络(STA-GCN)模型的人体骨架动作识别算法。该模型包含空间注意力机制和时间注意力机制:空间注意力机制一方面利用光流特征中的瞬时运动信息定位运动显著的空间区域,另一方面在训练过程中引入全局平均池化及辅助分类损失使得该模型可以关注到具有判别力的非运动区域;时间注意力机制则自动地从长时复杂视频中挖掘出具有判别力的时域片段。将这二者融合到统一的图卷积网络(GCN)框架中,实现了端到端的训练。在Kinetics和NTU RGB+D两个公开数据集的对比实验结果表明,基于STA-GCN模型的人体骨架动作识别算法具有很强的鲁棒性与稳定性,与基于时空图卷积网络(ST-GCN)模型的识别算法相比,在Kinetics数据集上的Top-1和Top-5分别提升5.0和4.5个百分点,在NTURGB+D数据集的CS和CV上的Top-1分别提升6.2和6.7个百分点;也优于当前行为识别领域最先进(SOA)方法,如Res-TCN、STA-LSTM和动作-结构图卷积网络(AS-GCN)。结果表示,所提算法可以更好地满足人体行为识别的实际应用需求。 展开更多
关键词 图卷积网络 人体骨架行为识别 注意力机制 人体关节点 视频行为理解
下载PDF
基于实例分割的车道线检测及自适应拟合算法 被引量:11
4
作者 田锦 袁家政 刘宏哲 《计算机应用》 CSCD 北大核心 2020年第7期1932-1937,共6页
车道线检测是智能驾驶系统的重要组成部分。传统车道线检测方法高度依赖手动选取特征,工作量大,在受到物体遮挡、光照变化和磨损等复杂场景的干扰时精度不高,因此设计一个鲁棒的检测算法面临着很大挑战。为了克服这些缺点,提出了一种基... 车道线检测是智能驾驶系统的重要组成部分。传统车道线检测方法高度依赖手动选取特征,工作量大,在受到物体遮挡、光照变化和磨损等复杂场景的干扰时精度不高,因此设计一个鲁棒的检测算法面临着很大挑战。为了克服这些缺点,提出了一种基于深度学习实例分割方法的车道线检测模型。该模型基于改进的Mask R-CNN模型,首先利用实例分割模型对道路图像进行分割,提高车道特征信息的检测能力;然后使用聚类模型提取离散的车道线特征信息点;最后提出一种自适应拟合的方法,结合直线和多项式两种拟合方法对不同视野内的特征点进行拟合,生成最优车道线参数方程。实验结果表明,该方法提高了检测速度,在不同场景下都具有较好的检测精度,能够实现对各种复杂实际条件下的车道线信息的鲁棒提取。 展开更多
关键词 车道线检测 智能驾驶 深度学习 实例分割 自适应拟合
下载PDF
基于伪三维卷积神经网络的手势姿态估计 被引量:3
5
作者 张宏源 袁家政 +3 位作者 刘宏哲 原春锋 王雪峤 邓智方 《计算机应用研究》 CSCD 北大核心 2020年第4期1230-1233,1243,共5页
大多数现有的基于深度学习的手势姿态估计方法都使用标准三维卷积神经网络提取三维特征,估计手部关节坐标。该方法提取的特征缺乏手部的多尺度信息,限制了手势姿态估计的精度。另外,由于三维卷积神经网络巨大的计算成本和内存需求,这些... 大多数现有的基于深度学习的手势姿态估计方法都使用标准三维卷积神经网络提取三维特征,估计手部关节坐标。该方法提取的特征缺乏手部的多尺度信息,限制了手势姿态估计的精度。另外,由于三维卷积神经网络巨大的计算成本和内存需求,这些方法常难以满足实时性要求。为了克服这些缺点,提出以空间滤波器和深度滤波器级联的方式模拟三维卷积,减少网络参数量。同时,在各个尺度上提取手势姿态特征并加以整合,充分利用手势的三维信息。实验表明,该方法能有效提高手势姿态估计精度,减小模型尺寸,且在具有单块GPU的计算机上能以超过119 fps的速度运行。 展开更多
关键词 手势姿态估计 伪三维卷积神经网络 三维特征 深度图像 深度学习
下载PDF
基于3D卷积神经网络的视频哈希算法 被引量:4
6
作者 刘玉莹 刘宏哲 +1 位作者 袁家政 李兵 《计算机应用研究》 CSCD 北大核心 2020年第3期887-890,900,共5页
针对目前相似性视频检索方法中快速性和准确性仍无法满足用户要求等问题,提出了一种基于3D卷积神经网络的视频快速检索方法。该算法将3D卷积神经网络与哈希学习方法结合应用于视频数据,既能快速学习视频时空特征表示,又能极大地缩短视... 针对目前相似性视频检索方法中快速性和准确性仍无法满足用户要求等问题,提出了一种基于3D卷积神经网络的视频快速检索方法。该算法将3D卷积神经网络与哈希学习方法结合应用于视频数据,既能快速学习视频时空特征表示,又能极大地缩短视频检索时间。在常用视频数据集上的实验结果表明,利用所提出的方法对视频进行相似性检索性能优于当前主流方法。 展开更多
关键词 深度学习 哈希算法 视频检索
下载PDF
基于浅三维稠密网的多模态手势识别算法 被引量:3
7
作者 邓智方 袁家政 +2 位作者 刘宏哲 原春锋 张宏源 《计算机工程与应用》 CSCD 北大核心 2019年第19期166-172,共7页
手势识别旨在理解人体的动态手势,是人机交互领域极其重要的交互方式之一。该方法通过将二维稠密网扩展为三维稠密网,并加入Inception结构,提出了一种基于浅三维稠密网的多模态手势识别方法,将其命名为Spatial Temporal 3D(ST3D) dense ... 手势识别旨在理解人体的动态手势,是人机交互领域极其重要的交互方式之一。该方法通过将二维稠密网扩展为三维稠密网,并加入Inception结构,提出了一种基于浅三维稠密网的多模态手势识别方法,将其命名为Spatial Temporal 3D(ST3D) dense network。所提出的方法在手势识别公开数据集大规模离散手势数据集(IsoGD)上进行了评估,并取得了目前最好效果。实验证明,所提方法能够有效地学习到视频样本中手势的短期、中期以及长期时空特征。 展开更多
关键词 ST3D方法 Inception结构 多模态 手势识别
下载PDF
基于CNN与关键区域特征的人脸表情识别算法 被引量:11
8
作者 薛建明 刘宏哲 +3 位作者 袁家政 王雪峤 李青 杨少鹏 《传感器与微系统》 CSCD 2019年第10期146-149,153,共5页
为了克服目前公开的人脸表情数据集的数据量较少,并且有一些类别的表情表达存在一定的相似这两个因素对人脸表情识别率的影响,提出一种基于关键区域特征融合的人脸表情分类算法。算法首先提取人脸图像中表情表达的关键区域,然后分别提... 为了克服目前公开的人脸表情数据集的数据量较少,并且有一些类别的表情表达存在一定的相似这两个因素对人脸表情识别率的影响,提出一种基于关键区域特征融合的人脸表情分类算法。算法首先提取人脸图像中表情表达的关键区域,然后分别提取关键区域的特征信息并融合,最终使用融合的特征进行分类。通过实验验证:算法在JAFFE和CK+公开数据集上均取得了较好的识别准确率。 展开更多
关键词 表情识别 深度卷积神经网络 关键区域 特征融合
下载PDF
基于Inliers跟踪统计的RGB-D室内定位与地图构建 被引量:4
9
作者 牛小宁 刘宏哲 +1 位作者 袁家政 宣寒宇 《计算机工程》 CAS CSCD 北大核心 2018年第9期15-21,27,共8页
室内移动机器人同时定位与地图构建(SLAM)的前端位姿估计与后端优化容易受运动模糊的干扰。为此,提出一种基于Inliers跟踪统计的室内定位与地图构建算法。对RGB图像进行特征提取和匹配,运用RANSAC算法得到Inliers后,通过对Inliers数量... 室内移动机器人同时定位与地图构建(SLAM)的前端位姿估计与后端优化容易受运动模糊的干扰。为此,提出一种基于Inliers跟踪统计的室内定位与地图构建算法。对RGB图像进行特征提取和匹配,运用RANSAC算法得到Inliers后,通过对Inliers数量的跟踪与统计剔除受相机运动影响的模糊图像,然后利用最近邻迭代的非线性优化方法求解相机位姿。在此基础上,通过闭环检测和优化后的全局位姿拼接出运动轨迹和三维稠密点云图。实验结果表明,相对RGB-D SLAM算法,该算法能够有效提高SLAM系统的建图鲁棒性与精度。 展开更多
关键词 RGB-D相机 同时定位与地图构建 特征匹配 Inliers匹配内点 非线性优化 最近邻迭代算法
下载PDF
基于改进弦截法的FastICA算法研究 被引量:2
10
作者 张启坤 刘宏哲 +1 位作者 袁家政 龚灵杰 《计算机应用研究》 CSCD 北大核心 2019年第2期425-429,共5页
针对FastICA算法的收敛性易受初始解混矩阵的初值选择影响,引入梯度下降法降低初值选择敏感性,并且提出改进弦截法,加快收敛速度。实验结果显示,基于改进弦截法的FastICA算法与其他FastICA算法相比,不但提高了算法的分离性能,而且减少... 针对FastICA算法的收敛性易受初始解混矩阵的初值选择影响,引入梯度下降法降低初值选择敏感性,并且提出改进弦截法,加快收敛速度。实验结果显示,基于改进弦截法的FastICA算法与其他FastICA算法相比,不但提高了算法的分离性能,而且减少了迭代次数,增强了收敛稳定性。所以,改进的FastICA算法克服了初值选择敏感的影响,获得更快速、更鲁棒的语音分离性能。 展开更多
关键词 盲源分离 固定点算法 梯度下降法 改进弦截法 语音分离
下载PDF
一种有效深度哈希图像拷贝检测算法
11
作者 刘琴 袁家政 +3 位作者 刘宏哲 李兵 王佳颖 叶子 《计算机应用与软件》 北大核心 2020年第3期213-219,303,共8页
目前拷贝检测中的图像哈希方法由于手工设计特征和线性映射带来的限制,检测精度不高。为了解决这一难题,提出一种端到端的深度哈希拷贝检测算法——DHCD。构建多尺度孪生卷积神经网络,以空间金字塔分层池化的方式来获得图像对的显著性特... 目前拷贝检测中的图像哈希方法由于手工设计特征和线性映射带来的限制,检测精度不高。为了解决这一难题,提出一种端到端的深度哈希拷贝检测算法——DHCD。构建多尺度孪生卷积神经网络,以空间金字塔分层池化的方式来获得图像对的显著性特征;在新设计的哈希损失函数作用下,既保持了特征在语义结构上的相关性,又使得特征输出接近于目标哈希码;通过挖掘难分样本,[JP2]对难分样本再训练,提升了模型的识别效果。在拷贝数据集上的实验结果表明,该算法与当前主流的图像哈希算法相比,准确率提升了10%左右,且效率没有降低。 展开更多
关键词 拷贝检测 深度哈希 多尺度 哈希损失 挖掘难分样本
下载PDF
刍议高职电子信息类教师教学能力提升分析
12
作者 杨思阳 袁家政 《数码设计》 2018年第13期55-55,共1页
一直以来,我国高职电子信息类教育的教学发展历史较为长远,但是目前我国高职电子信息类教育的水平仍然落后于其他国家地区,导致这种教学现象出现的原因有很多,其中,高职电子信息类教师的教学能力不足、教学观念落后是阻碍我国高职电子... 一直以来,我国高职电子信息类教育的教学发展历史较为长远,但是目前我国高职电子信息类教育的水平仍然落后于其他国家地区,导致这种教学现象出现的原因有很多,其中,高职电子信息类教师的教学能力不足、教学观念落后是阻碍我国高职电子信息类教学进度推进的重要原因。本文主要分析目前我国高职院校电子信息类教师的教学能力现状,并提出能够有效提升电子信息类教师教学能力的有效对策。 展开更多
关键词 高职 电子信息 分析
下载PDF
A graph theory model using human nature structure
13
作者 Liu Jia Hu Haimiao +2 位作者 Duan Miyi Li Wenfa yuan jiazheng 《High Technology Letters》 EI CAS 2017年第4期350-359,共10页
A graph theory model of the human nature structure( GMH) for machine vision and image/graphics processing is described in this paper. Independent from the motion and deformation of contours,the human nature structure(... A graph theory model of the human nature structure( GMH) for machine vision and image/graphics processing is described in this paper. Independent from the motion and deformation of contours,the human nature structure( HNS) embodies the most basic movement characteristics of the body. The human body can be divided into basic units like head,torso,and limbs. Using these basic units,a graph theory model for the HNS can be constructed. GMH provides a basic model for human posture processing,and the outline in the perspective projection plane is the body contour of an image. In addition,the GMH can be applied to articulated motion and deformable objects,e. g.,in the design and analysis of body posture,by modifying mapping parameters of the GMH. 展开更多
关键词 articulated motion and deformable objects(AMDO) human nature structure(HNS) graph theory machine vision image/graphics processing
下载PDF
铝胁迫对八仙花品种‘玫红妈妈’花色的影响 被引量:3
14
作者 胡奕挺 袁家珍 陈海霞 《分子植物育种》 CAS 北大核心 2021年第18期6164-6171,共8页
花色是花卉最重要的观赏性状之一。本研究以八仙花品种‘玫红妈妈’为材料,通过对土壤施用不同浓度铝胁迫处理,探究‘玫红妈妈’在铝胁迫下花色变化的生理和分子机理。结果表明:不同浓度AlCl3溶液处理对花萼颜色由红到蓝紫的转变有显著... 花色是花卉最重要的观赏性状之一。本研究以八仙花品种‘玫红妈妈’为材料,通过对土壤施用不同浓度铝胁迫处理,探究‘玫红妈妈’在铝胁迫下花色变化的生理和分子机理。结果表明:不同浓度AlCl3溶液处理对花萼颜色由红到蓝紫的转变有显著影响。检测出‘玫红妈妈’花萼主要含有的花青素苷成分为飞燕草素-3-葡萄糖苷,伴随花萼的不断发育,其在CK、10μmol/L和50μmol/L AlCl3溶液处理下含量递增,在100μmol/L浓度处理下先升高再降低。50μmol/L的AlCl3溶液处理下,花萼中Al3+含量在花发育过程中相较于CK显著上升,100μmol/L浓度处理下,其含量不断下降。随着所施AlCl3溶液浓度的升高,可溶性糖和可溶性蛋白含量均表现为不断上升的趋势。花青素苷转运相关基因HmABCC1基因在10、50和100μmol/L AlCl3溶液处理后表达上调,相较于CK分别上调26%、98%和16%。本研究进一步揭示了八仙花在铝胁迫下的花色变化机理,为满足市场需求的稳定蓝紫色系八仙花的培育提供了参考。 展开更多
关键词 八仙花 铝胁迫 花色分析 花青素苷 ABCC1基因
原文传递
GrabCut image segmentation algorithm based on structure tensor 被引量:3
15
作者 Zhang Yong yuan jiazheng +1 位作者 Liu Hongzhe Li Qing 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2017年第2期38-47,共10页
This paper attempts to present an interactive color natural images segmentation method. This method extracts the feature of images by using the nonlinear compact structure tensor (NCST) and then uses GrabCut method ... This paper attempts to present an interactive color natural images segmentation method. This method extracts the feature of images by using the nonlinear compact structure tensor (NCST) and then uses GrabCut method to obtain the segmentation. This method not only realizes the non-parametric fusion of texture information and color information, but also improves the efficiency of the calculation. Then, the improved GrabCut algorithm is used to evaluate the foreground target segmentation. In order to calculate the simplicity and efficiency, this paper also extends the Gaussian mixture model (GMM) constructed base on the GrabCut to the tensor space, and uses the Kullback-Leibler (KL) divergence instead of the usual Riemannian geometry. Lastly, an iteration convergence criterion is proposed to reduce the time of the iteration of GrabCut algorithm dramatically with satisfied segmentation accuracy. After conducting a large number of experiments on synthetic texture images and natural images, the results demonstrate that this method has a more accurate segmentation effect. 展开更多
关键词 image segmentation structure tensor GRABCUT Kullback-Leibler GMM
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部