期刊文献+
共找到286篇文章
< 1 2 15 >
每页显示 20 50 100
Digital watermarking algorithm based on scale-invariant feature regions in non-subsampled contourlet transform domain 被引量:8
1
作者 Jian Zhao Na Zhang +1 位作者 Jian Jia Huanwei Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第6期1310-1315,共6页
Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy... Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy sub-band after NSCT is selected to embed watermark. The watermark is embedded into scaleinvariant feature transform (SIFT) regions. During embedding, the initial region is divided into some cirque sub-regions with the same area, and each watermark bit is embedded into one sub-region. Extensive simulation results and comparisons show that the algorithm gets a good trade-off of invisibility, robustness and capacity, thus obtaining good quality of the image while being able to effectively resist common image processing, and geometric and combo attacks, and normalized similarity is almost all reached. 展开更多
关键词 multi-scale geometric analysis (MGA) non-subsampled contourlet transform (NSCT) scale-invariant featureregion.
下载PDF
Spectral matching algorithm based on nonsubsampled contourlet transform and scale-invariant feature transform 被引量:4
2
作者 Dong Liang Pu Yan +2 位作者 Ming Zhu Yizheng Fan Kui Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第3期453-459,共7页
A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low freq... A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low frequency image and several high frequency images, and the scale-invariant feature transform is employed to extract feature points from the low frequency im- age. A proximity matrix is constructed for the feature points of two related images. By singular value decomposition of the proximity matrix, a matching matrix (or matching result) reflecting the match- ing degree among feature points is obtained. Experimental results indicate that the proposed algorithm can reduce time complexity and possess a higher accuracy. 展开更多
关键词 point pattern matching nonsubsampled contourlet transform scale-invariant feature transform spectral algorithm.
下载PDF
面向人体姿态图像关键点检测的深度学习算法
3
作者 曾文献 李岳松 《计算机仿真》 2024年第5期209-213,219,共6页
传统人体姿态检测方法提取图像信息能力弱,易受背景环境干扰,在图像辨识上具有一定的局限性。为解决由于背景干扰而导致的人体姿态识别准确率低、计算效率差的问题,提出了一种基于人体关键点骨架合成与上深度学习姿态识别算法相结合的... 传统人体姿态检测方法提取图像信息能力弱,易受背景环境干扰,在图像辨识上具有一定的局限性。为解决由于背景干扰而导致的人体姿态识别准确率低、计算效率差的问题,提出了一种基于人体关键点骨架合成与上深度学习姿态识别算法相结合的框架体系。首先采用MobileNet残差网络优化Open Pose网络结构,降低人体骨骼关键点识别的计算复杂度,提高计算效率;然后通过PAF算法预测骨架的最优连通域,构建出最优人体骨架信息,并基于最优骨架信息生成人体骨架辅助框提取法则,提取人体姿态的相对位置,解决环干扰的问题;接着将人体关键点特征与HOG特征有机融合,基于深度学习网络构建出OP-GAN人体姿态识别模型。仿真结果表明,与传统SVM模型相比,OP-GAN模型的F1综合性能指标提升了6.85%;与其它深度学习算法相比,关键点特征的融合以及GAN网络的使用均与模型的性能指标呈正相关关系。因此,新构建的OP-GAN人体姿态识别模型通过解决背景干扰的同时,提高了人体姿态识别的准确率与效率。 展开更多
关键词 关键点检测 人体姿态识别 深度学习算法
下载PDF
基于深度学习的二维人体姿态估计研究进展
4
作者 卢官明 卢峻禾 陈晨 《南京邮电大学学报(自然科学版)》 北大核心 2024年第1期44-55,共12页
人体姿态估计在人体行为识别、人机交互、体育运动分析等方面有着广泛的应用前景,是计算机视觉领域的一个研究热点。在最近的十年中,得益于深度学习技术,大量的研究工作极大地推动了人体姿态估计技术的发展,但由于受训练样本不足、人体... 人体姿态估计在人体行为识别、人机交互、体育运动分析等方面有着广泛的应用前景,是计算机视觉领域的一个研究热点。在最近的十年中,得益于深度学习技术,大量的研究工作极大地推动了人体姿态估计技术的发展,但由于受训练样本不足、人体姿态的多变性、遮挡、环境的复杂性等因素影响,人体姿态估计仍然面临着诸多的挑战。文中对近年来基于深度学习的2D人体姿态估计方法进行归纳和总结,着重分析一些有代表性的人体姿态估计方法的思路及工作原理,以便研究人员了解当前的研究现状、面临的挑战以及今后的研究方向,拓展研究思路。 展开更多
关键词 人体姿态估计 单人体姿态估计 多人体姿态估计 深度学习 关键点检测
下载PDF
基于锚点的快速三维手部关键点检测算法
5
作者 秦晓飞 何文 +2 位作者 班东贤 郭宏宇 于景 《电子科技》 2024年第4期77-86,共10页
在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模... 在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模块(Global-Local Feature Fusion,GLFF)对骨干网络浅层和深层的特征进行融合。为了提升检测速度,文中将A2J的骨干网络替换为ShuffleNetv2并对其进行改造,用5×5深度可分离卷积替换3×3深度可分离卷积,增大感受野,有效提升了骨干网络对全局特征的提取能力。文中在锚点权重估计分支引入高效通道注意力模块(Efficient Channel Attention,ECA),提升了网络对重要锚点的关注度。在主流数据集ICVL和NYU上进行的训练和测试结果表明,相比于A2J,文中所提方法的平均误差分别降低了0.09 mm和0.15 mm。在GTX1080Ti显卡上实现了151 frame·s^(-1)的检测速率,满足人机协作任务对于实时性的要求。 展开更多
关键词 人机协作 三维手部关键点检测 锚点 深度图 全局-局部特征融合 ShuffleNetv2 深度可分离卷积 高效通道注意力
下载PDF
挥发窑鼓风管的关键点识别及其摆放位置监测 被引量:1
6
作者 易佞纯 桂卫华 +3 位作者 梁骁俊 张超波 唐峰润 阳春华 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第1期172-182,共11页
窑头鼓风管的摆放位置是影响氧化锌挥发窑燃烧状态的重要操作参数之一,现仍由人工看火来手动调节,同时现场没有为挥发窑的运行优化记录完善的鼓风状态数据,也难以及时发现鼓风管被窑内渣块击中等安全隐患.针对上述问题,本文提出一种基... 窑头鼓风管的摆放位置是影响氧化锌挥发窑燃烧状态的重要操作参数之一,现仍由人工看火来手动调节,同时现场没有为挥发窑的运行优化记录完善的鼓风状态数据,也难以及时发现鼓风管被窑内渣块击中等安全隐患.针对上述问题,本文提出一种基于关键点识别的鼓风管位置监测方法.首先,文章对从窑头看火口采集的火焰视频数据集设计一种邻域关键点辅助的数据扩充方法,并构建级联金字塔网络(CPN)来预测鼓风管管口中心点的位置;然后,本文提出一种基于多帧图像的聚类分析算法来消除因烟尘遮挡所产生的异常点,并采用一种量化指标来实现对挥发窑鼓风管摆放位置的实时感知与记录;最后,本文基于现场采集的火焰视频数据进行了对比实验,结果表明所提出的关键点检测模型精度高、鲁棒性强,且鼓风管位置的量化准确率高达92.3%. 展开更多
关键词 火焰视频 鼓风管位置 关键点检测 卷积神经网络 聚类分析
下载PDF
2023中国教育技术研究前沿与热点年度报告 被引量:1
7
作者 李雅瑄 陈昂轩 贾积有 《中国电化教育》 北大核心 2024年第3期121-126,共6页
2023年是全面贯彻党的二十大精神的开局之年,教育技术领域全力思考和回答“教育强国、技术何为”的时代命题。中国教育技术研究脉络清晰,紧紧锚定党和国家重大战略需求,牢牢把握中国式教育现代化这一根本指针,从教育数字化转型中汲取发... 2023年是全面贯彻党的二十大精神的开局之年,教育技术领域全力思考和回答“教育强国、技术何为”的时代命题。中国教育技术研究脉络清晰,紧紧锚定党和国家重大战略需求,牢牢把握中国式教育现代化这一根本指针,从教育数字化转型中汲取发展动力,以新课标实施与教育评价改革为研究的关键着力点,依托国家智慧教育公共服务平台的建设与应用探索出了现实研究路径,并突出了振兴乡村教育、助推教育公平与高质量发展这一时代责任。2024年,中国教育技术研究将继续牢牢把握新一轮科技革命和产业变革新机遇,坚持“以人为本”的基础理论引导,坚持深化落实国家教育数字化战略,坚持推动终身学习的中国方案,助力教育改革的深水突围,为中国式教育现代化贡献智慧力量。 展开更多
关键词 中国教育技术 中国电化教育 研究重点 研究脉络 未来展望
下载PDF
基于计算机视觉的钢桥螺栓松动检测方法
8
作者 劳武略 徐威 +3 位作者 张清华 罗纯坤 崔闯 陈杰 《铁道学报》 EI CAS CSCD 北大核心 2024年第1期91-102,共12页
为提高螺栓松动检测的智能化水平,提出一种基于计算机视觉的钢桥螺栓松动检测方法。首先基于深度学习理论建立关键点检测模型,对采集的螺栓图像进行标注并建立数据集;然后分别训练目标检测模型YoloV5和关键点检测模型,并利用训练后的模... 为提高螺栓松动检测的智能化水平,提出一种基于计算机视觉的钢桥螺栓松动检测方法。首先基于深度学习理论建立关键点检测模型,对采集的螺栓图像进行标注并建立数据集;然后分别训练目标检测模型YoloV5和关键点检测模型,并利用训练后的模型自上而下检测螺栓关键点,根据关键点确定螺栓中心点位置,以中心点的相对位置求解透视变换矩阵,利用透视变换矩阵对关键点进行重投影;最后根据关键点的位置变化检测螺栓是否发生松动。结果表明:训练后的YoloV5模型和关键点检测模型可准确检测出螺栓的关键点;关键点的检测精度受图像采集条件影响且对角度更为敏感;利用所有中心点拟合透视变换矩阵的最小二乘解可提高图像几何矫正的精度;不同图像采集环境下,松动螺栓的检测误差在0%~9.6%之间,误检率为2.7%,表明本方法的检测精度和稳定性均较高,具有较好的实用价值和广阔的工程应用前景。 展开更多
关键词 钢桥螺栓 松动检测 计算机视觉 目标检测 关键点检测
下载PDF
基于骨架特征的人体跌倒检测
9
作者 汤发源 赵永兴 +2 位作者 刘晓亮 赵欣 王京华 《传感器与微系统》 CSCD 北大核心 2024年第3期115-119,124,共6页
针对现有基于人体骨架跌倒检测设备要求高的问题,提出了一种基于轻量级OpenPose生成骨架特征的跌倒检测方法。首先,基于轻量级OpenPose网络检测人体关键点,利用人体部分关键点生成边界框,并对关键点坐标进行标准化处理,将边界框的纵横... 针对现有基于人体骨架跌倒检测设备要求高的问题,提出了一种基于轻量级OpenPose生成骨架特征的跌倒检测方法。首先,基于轻量级OpenPose网络检测人体关键点,利用人体部分关键点生成边界框,并对关键点坐标进行标准化处理,将边界框的纵横比和标准化后的关键点坐标作为表示人体姿态的特征向量。最后,将人体姿态特征向量作为多层感知机(MLP)的输入,判断人体是否发生跌倒。实验结果表明,基于单目相机采集图片构造的自定义跌倒数据集,网络可以实现98.64%的跌倒检测准确率,并且在CoreTMi5—9300H CPU上达到20fps的检测速度。 展开更多
关键词 关键点 边界框 特征向量 多层感知机 跌倒检测
下载PDF
基于双目立体匹配与改进YOLOv8n-Pose关键点检测的奶牛体尺测量方法
10
作者 邓洪兴 许兴时 +2 位作者 王云飞 张姝瑾 宋怀波 《华南农业大学学报》 CAS CSCD 北大核心 2024年第5期802-811,共10页
【目的】实现奶牛体尺准确测量,精准评定奶牛体型。【方法】针对奶牛体尺测量精度有限、自动化程度低等问题,提出一种基于双目立体匹配和改进YOLOv8n-Pose的奶牛体尺测量方法,利用CREStereo获取深度信息,在YOLOv8n-Pose中引入SimAM注意... 【目的】实现奶牛体尺准确测量,精准评定奶牛体型。【方法】针对奶牛体尺测量精度有限、自动化程度低等问题,提出一种基于双目立体匹配和改进YOLOv8n-Pose的奶牛体尺测量方法,利用CREStereo获取深度信息,在YOLOv8n-Pose中引入SimAM注意力机制,使网络更加关注奶牛个体识别及奶牛关键点位置信息,并采用CoordConv卷积改进网络结构,增强网络空间坐标感知能力。【结果】改进的YOLOv8n-Pose可快速准确检测奶牛体尺测量关键点,检测精度为94.3%,模型参数量为2.99 M,浮点计算量为8.40 G,检测速度为55.6帧/s。融合双目立体匹配与改进YOLOv8n-Pose关键点检测的奶牛体尺测量最大平均相对误差为4.19%。【结论】所提出的体尺测量方法具有较高的精度及较快的检测速度,能够满足奶牛体尺测量的实用要求。 展开更多
关键词 体尺测量 双目立体视觉 关键点检测 奶牛
下载PDF
基于多关键点检测加权融合的无人机相对位姿估计算法
11
作者 葛泉波 李凯 张兴国 《自动化学报》 EI CAS CSCD 北大核心 2024年第7期1402-1416,共15页
针对无人机降落阶段中无人船受水面波浪影响导致图像产生运动模糊以及获取无人机相对位姿精度低且鲁棒性差的问题,提出一种基于多模型关键点加权融合的6D目标位姿估计算法,以提高位姿估计的精度和鲁棒性.首先,基于无人船陀螺仪得到的运... 针对无人机降落阶段中无人船受水面波浪影响导致图像产生运动模糊以及获取无人机相对位姿精度低且鲁棒性差的问题,提出一种基于多模型关键点加权融合的6D目标位姿估计算法,以提高位姿估计的精度和鲁棒性.首先,基于无人船陀螺仪得到的运动信息设计帧间抖动模型,通过还原图像信息达到降低图像噪声的目的;然后,设计一种多模型的级联回归特征提取算法,通过多模型检测舰载视觉系统获取的图像,以增强特征空间的多样性;同时,将检测过程中关键点定位形状增量集作为融合权重对模型进行加权融合,以提高特征空间的鲁棒性;紧接着,利用EPnP(Efficient perspective-n-point)计算关键点相机坐标系坐标,将PnP(Perspective-n-point)问题转化为ICP(Iterative closest point)问题;最终,基于关键点解集的离散度为关键点赋权,使用ICP算法求解位姿以削弱深度信息对位姿的影响.仿真结果表明,该算法能够建立一个精度更高的特征空间,使得位姿解算时特征映射的损失降低,最终提高位姿解算的精度. 展开更多
关键词 辅助无人机降落 舰载视觉系统 6D 位姿估计 加权融合 关键点检测 级联特征提取
下载PDF
基于多尺度增量学习的单人体操动作中关键点检测方法
12
作者 江佳鸿 夏楠 +2 位作者 李长吾 周思瑶 于鑫淼 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1730-1742,共13页
人体关键点检测是计算机视觉的热点研究领域.目前,对于体操动作关键点检测,仍存在检测精度不足及缺乏细节部位检测能力等问题.为了提升检测精度,本文设计了一种多分辨率网络,该网络在浅层具备较大感受野,同时能够利用高分辨率通道增强... 人体关键点检测是计算机视觉的热点研究领域.目前,对于体操动作关键点检测,仍存在检测精度不足及缺乏细节部位检测能力等问题.为了提升检测精度,本文设计了一种多分辨率网络,该网络在浅层具备较大感受野,同时能够利用高分辨率通道增强细节特征的提取能力.为实现对手部及脚部关键点的检测,设计了一种增量学习网络.该网络融合了多分辨率网络的浅层特征并利用自建数据集计算深层特征以提升网络对手部及脚部关键点的检测能力.最后对两个网络输出结果进行合并.计算机仿真表明,多分辨率网络在COCO2017关键点检测数据集上达到了94.4%的准确率,并且增量学习网络能够在训练数据较少的情况下实现对细节部位关键点的准确检测. 展开更多
关键词 人体关键点检测 体操动作 多分辨率网络 增量学习 权重融合
下载PDF
基于筛选学习网络的六自由度目标位姿估计算法
13
作者 邴雅星 王阳萍 +1 位作者 雍玖 白浩谋 《计算机应用》 CSCD 北大核心 2024年第6期1920-1926,共7页
针对在复杂场景下对弱纹理目标位姿估计的准确性和实时性问题,提出基于筛选学习网络的六自由度(6D)目标位姿估计算法。首先,将标准卷积替换为蓝图可分离卷积(BSConv)以减少模型参数,并使用GeLU(Gaussian error Linear Unit)激活函数,能... 针对在复杂场景下对弱纹理目标位姿估计的准确性和实时性问题,提出基于筛选学习网络的六自由度(6D)目标位姿估计算法。首先,将标准卷积替换为蓝图可分离卷积(BSConv)以减少模型参数,并使用GeLU(Gaussian error Linear Unit)激活函数,能够更好地逼近正态分布,以提高网络模型的性能;其次,提出上采样筛选编码信息模块(UFAEM),弥补了上采样关键信息丢失的缺陷;最后,提出一种全局注意力机制(GAM),增加上下文信息,更有效地提取输入特征图的信息。在公开数据集LineMOD、YCB-Video和Occlusion LineMOD上测试,实验结果表明,所提算法在网络参数大幅度减少的同时提升了精度。所提算法网络参数量减少近3/4,采用ADD(-S) metric指标,在lineMOD数据集下较Dual-Stream算法精度提升约1.2个百分点,在YCB-Video数据集下较DenseFusion算法精度提升约5.2个百分点,在Occlusion LineMOD数据集下较像素投票网络(PVNet)算法精度提升约6.6个百分点。通过实验结果可知,所提算法对弱纹理目标位姿估计具有较好的效果,对遮挡物体位姿估计具有一定的鲁棒性。 展开更多
关键词 目标姿态估计 蓝图可分离卷积 注意力机制 关键点 深度学习
下载PDF
基于关键点检测和多目标跟踪的猪只体尺估计
14
作者 姚裔芃 徐晨 +2 位作者 陈鸿基 刘勇 徐顺来 《华南农业大学学报》 CAS CSCD 北大核心 2024年第5期722-729,共8页
【目的】减少猪场人工测量猪只体尺的工作量,提高测量精度和工作效率。【方法】本研究提出基于关键点检测和多目标跟踪的猪只体尺自动估计方法,该方法使用Yolov8-Pose模型识别各猪只关键点和目标检测框,利用ByteTrack算法对猪群实时跟踪... 【目的】减少猪场人工测量猪只体尺的工作量,提高测量精度和工作效率。【方法】本研究提出基于关键点检测和多目标跟踪的猪只体尺自动估计方法,该方法使用Yolov8-Pose模型识别各猪只关键点和目标检测框,利用ByteTrack算法对猪群实时跟踪,引入感兴趣区域规避图像畸变,提高识别速度,同时设计姿态和异常检测过滤算法减少因运动模糊、姿态不正等因素造成的误差。【结果】5个猪栏中24头猪只体长、肩宽、臀宽的平均绝对误差均小于3 cm,平均绝对百分比误差分别维持在4%、6%和7%以内。数据处理速度提升为19.3帧/s。【结论】本研究提出的基于关键点检测和多目标跟踪的猪只体尺估计方法为猪场生产场景提供了一个轻量化、易部署的自动体尺测量解决方案。 展开更多
关键词 Yolov8-Pose 感兴趣区域 体尺估计 关键点 目标检测框
下载PDF
基于关键点检测的服装廓形识别
15
作者 陶金之 夏明 王伟 《纺织学报》 EI CAS CSCD 北大核心 2024年第6期142-148,共7页
为精准且快速地实现对服装廓形的判断,以秀场连衣裙为研究对象,提出了基于关键点检测的服装廓形分类算法。使用YOLO v8-Pose模型对秀场连衣裙进行关键点检测,提取服装的肩部、胸部、腰部、臀部和底摆两侧共10个关键点,并生成服装廓形图... 为精准且快速地实现对服装廓形的判断,以秀场连衣裙为研究对象,提出了基于关键点检测的服装廓形分类算法。使用YOLO v8-Pose模型对秀场连衣裙进行关键点检测,提取服装的肩部、胸部、腰部、臀部和底摆两侧共10个关键点,并生成服装廓形图。通过加入Sobel边缘提取算法改进的DenseNet网络深度提取服装廓形特征,采用余弦相似度算法将其与标准的廓形库中提取的特征相比较,最终实现服装廓形的判别与分类。结果表明,该方法能够快速且准确地实现服装廓形的分类,廓形分类准确率达到了95.9%。 展开更多
关键词 服装 廓形分类 YOLO v8-Pose 关键点检测 DenseNet网络 相似度算法 连衣裙
下载PDF
改进的DeepLabCut鱼类游动轨迹提取
16
作者 雷帮军 裴斐 +1 位作者 吴正平 张海镔 《渔业现代化》 CSCD 北大核心 2024年第2期61-69,共9页
针对现有的鱼类游动轨迹提取方法在提取效率和准确率方面不能同时兼顾的问题,提出了一种改进的DeepLabCut方法用于鱼类背部关键点识别和定位。首先,选择了轻量级卷积神经网络模型EfficientNet-B0作为DeepLabCut的主干网络模型,用于提取... 针对现有的鱼类游动轨迹提取方法在提取效率和准确率方面不能同时兼顾的问题,提出了一种改进的DeepLabCut方法用于鱼类背部关键点识别和定位。首先,选择了轻量级卷积神经网络模型EfficientNet-B0作为DeepLabCut的主干网络模型,用于提取鱼类背部关键点的特征,为了增强EfficientNet-B0的表征能力,在网络模型中引入了改进的CBAM(Convolutional Block Attention Module)注意力机制模块,将CBAM中的空间注意力模块和通道注意力模块从原来的串行连接方式改为并行连接,以解决两种注意力模块之间因串行连接而导致的互相干扰问题。其次,基于MSE(Mean Squared Error)损失函数提出了一种分段式损失函数H_MSE用于模型的训练,分段式损失函数H_MSE相对于传统的损失函数具有较强的鲁棒性,其在处理数据中的异常值时能表现出较低的敏感性。最后,采用了半监督学习方法对关键点进行自动标记来减少人工标记数据时产生的误差。结果显示:相比于DeepLabCut原始算法,识别误差RMSE(Root Mean Squared Error)平均降低了4.5像素;与目标检测算法Faster RCNN、SK-YOLOv5、ESB-YOLO、YOLOv8-Head-ECAM相比,识别误差RMSE平均降低了11.5像素,检测效果优于其他目标检测网络和原始网络,平均每张图像的检测时间为0.062 s,能够快速准确提取鱼道内鱼类的游动轨迹,为优化鱼道的水力设计指标提供了重要依据。 展开更多
关键词 鱼类识别 轨迹识别 关键点识别 DeepLabCut 半监督学习 损失函数 注意力机制
下载PDF
基于人体和场景上下文的多人3D姿态估计
17
作者 何建航 孙郡瑤 刘琼 《软件学报》 EI CSCD 北大核心 2024年第4期2039-2054,共16页
深度歧义是单帧图像多人3D姿态估计面临的重要挑战,提取图像上下文对缓解深度歧义极具潜力.自顶向下方法大多基于人体检测建模关键点关系,人体包围框粒度粗背景噪声占比较大,极易导致关键点偏移或误匹配,还将影响基于人体尺度因子估计... 深度歧义是单帧图像多人3D姿态估计面临的重要挑战,提取图像上下文对缓解深度歧义极具潜力.自顶向下方法大多基于人体检测建模关键点关系,人体包围框粒度粗背景噪声占比较大,极易导致关键点偏移或误匹配,还将影响基于人体尺度因子估计绝对深度的可靠性.自底向上的方法直接检出图像中的人体关键点再逐一恢复3D人体姿态.虽然能够显式获取场景上下文,但在相对深度估计方面处于劣势.提出新的双分支网络,自顶向下分支基于关键点区域提议提取人体上下文,自底向上分支基于三维空间提取场景上下文.提出带噪声抑制的人体上下文提取方法,通过建模“关键点区域提议”描述人体目标,建模姿态关联的动态稀疏关键点关系剔除弱连接减少噪声传播.提出从鸟瞰视角提取场景上下文的方法,通过建模图像深度特征并映射鸟瞰平面获得三维空间人体位置布局;设计人体和场景上下文融合网络预测人体绝对深度.在公开数据集MuPoTS-3D和Human3.6M上的实验结果表明:与同类先进模型相比,所提模型HSC-Pose的相对和绝对3D关键点位置精度至少提高2.2%和0.5%;平均根关键点位置误差至少降低4.2 mm. 展开更多
关键词 多人场景3D姿态估计 关键点区域提议 人体上下文 场景上下文 人体绝对深度
下载PDF
基于扩散模型的ControlNet网络虚拟试衣研究
18
作者 郭宇轩 孙林 《现代纺织技术》 北大核心 2024年第3期118-128,共11页
为快速生成特定服装款式的成衣效果图,采用扩散模型,应用ControlNet网络实现虚拟试衣。首先将人体的关键点检测图与深度图作为扩散模型的控制条件,生成姿态可控的虚拟模特;再通过Canny边缘图生成虚拟试衣效果图。以3款连衣裙为例进行虚... 为快速生成特定服装款式的成衣效果图,采用扩散模型,应用ControlNet网络实现虚拟试衣。首先将人体的关键点检测图与深度图作为扩散模型的控制条件,生成姿态可控的虚拟模特;再通过Canny边缘图生成虚拟试衣效果图。以3款连衣裙为例进行虚拟试衣实验,并优化扩散模型控制条件的参数设置;最后将生成结果与三维建模虚拟试衣结果进行对比和评价。结果表明:结合ControlNet网络的扩散模型能够控制虚拟模特的姿态特征,通过服装Canny边缘图可以生成特定服装款式的虚拟试衣效果。该方法生成的虚拟试衣相较三维建模技术实现的虚拟试衣方法更具表现力,操作更加直观快捷,能够为设计师提供款式图的成衣效果可视化参考,从而提高服装设计效率。 展开更多
关键词 虚拟试衣 扩散模型 CONTROLNET网络 虚拟模特 人体关键点检测 服装设计
下载PDF
Lightweight Multi-Resolution Network for Human Pose Estimation
19
作者 Pengxin Li Rong Wang +2 位作者 Wenjing Zhang Yinuo Liu Chenyue Xu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第3期2239-2255,共17页
Human pose estimation aims to localize the body joints from image or video data.With the development of deeplearning,pose estimation has become a hot research topic in the field of computer vision.In recent years,huma... Human pose estimation aims to localize the body joints from image or video data.With the development of deeplearning,pose estimation has become a hot research topic in the field of computer vision.In recent years,humanpose estimation has achieved great success in multiple fields such as animation and sports.However,to obtainaccurate positioning results,existing methods may suffer from large model sizes,a high number of parameters,and increased complexity,leading to high computing costs.In this paper,we propose a new lightweight featureencoder to construct a high-resolution network that reduces the number of parameters and lowers the computingcost.We also introduced a semantic enhancement module that improves global feature extraction and networkperformance by combining channel and spatial dimensions.Furthermore,we propose a dense connected spatialpyramid pooling module to compensate for the decrease in image resolution and information loss in the network.Finally,ourmethod effectively reduces the number of parameters and complexitywhile ensuring high performance.Extensive experiments show that our method achieves a competitive performance while dramatically reducing thenumber of parameters,and operational complexity.Specifically,our method can obtain 89.9%AP score on MPIIVAL,while the number of parameters and the complexity of operations were reduced by 41%and 36%,respectively. 展开更多
关键词 LIGHTWEIGHT human pose estimation keypoint detection high resolution network
下载PDF
基于改进U-Net的髋关节关键点检测算法
20
作者 陈震 姚京辉 苏成悦 《计算机与现代化》 2024年第2期15-19,28,共6页
使用骨盆X光片诊断发育性髋关节发育不良(Developmental Dysplasia of the Hip,DDH)要求准确地标注髋关节关键点,而深度学习方法能作为可靠的辅助工具。针对骨盆片拍摄姿势和拍摄距离多样化问题,本文基于U-Net提出了RKD-UNet来检测髋关... 使用骨盆X光片诊断发育性髋关节发育不良(Developmental Dysplasia of the Hip,DDH)要求准确地标注髋关节关键点,而深度学习方法能作为可靠的辅助工具。针对骨盆片拍摄姿势和拍摄距离多样化问题,本文基于U-Net提出了RKD-UNet来检测髋关节关键点。该模型使用残差块改进U-Net的卷积层和skip-connection路径,并将坐标注意力引入到编码器中以增强模型对关键点邻域的特征提取能力。在编码器顶部使用卷积和ASPP模块构成Bridge块,以[3,6,9]的空洞率融合不同尺度的特征信息并提升模型的感受野。本文使用包含骨盆正位片、蛙位片、下肢全长片和术后骨盆片的数据集训练和测试模型。RKD-UNet实现了3.19±2.19 px的平均关键点检测误差和2.83°±2.59°的平均髋臼角测量误差。对正常、轻度、中度和重度脱位案例诊断的F1分数分别达到89.6、77.1、57.9和94.1,高于医生的手动诊断结果。实验结果表明,RKD-UNet能准确检测髋关节关键点并辅助医生诊断DDH。 展开更多
关键词 深度学习 U-Net 关键点检测 发育性髋关节发育不良 辅助诊断
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部