期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多尺度引导注意力的人物图像合成方法研究
1
作者 邬成 葛斌 +1 位作者 郑海君 杨振文 《金陵科技学院学报》 2023年第1期12-19,共8页
针对现有生成对抗网络合成的人物图像存在的残缺和模糊问题,提出一种基于多尺度特征提取和姿势引导特征转换的人物图像合成方法。利用深度卷积神经网络对图像和姿势进行多尺度特征提取,有效获取丰富的语义信息;在不同尺度特征的转换过... 针对现有生成对抗网络合成的人物图像存在的残缺和模糊问题,提出一种基于多尺度特征提取和姿势引导特征转换的人物图像合成方法。利用深度卷积神经网络对图像和姿势进行多尺度特征提取,有效获取丰富的语义信息;在不同尺度特征的转换过程中注入引导注意力机制,利用姿势信息引导纹理特征进行正确转移和变换;使用马尔可夫判别网络(PatchGAN)作为判别器,增强对图像纹理细节的鉴别能力;最后在DeepFashion数据集上进行测试。结果表明:在定量上,该方法的结构相似度(SSIM)达到了0.7729,峰值信噪比(PSNR)达到了19.0604,Fréchet初始距离得分(FID)达到了11.4765,可学习感知图像块相似度(LPIPS)达到了0.2092;在定性上,比传统方法合成的人物图像具有更好的视觉效果。所提方法能有效解决残缺和模糊问题,提高合成人物图像的质量。 展开更多
关键词 生成对抗网络 多尺度特征 特征转换 人物图像合成 引导注意力机制
下载PDF
图像与问题双引导注意力机制视觉问答算法
2
作者 陈婷 王玉德 +2 位作者 任志伟 杨昊 高张弛 《通信技术》 2022年第1期36-42,共7页
针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法。模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成。该算法... 针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法。模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成。该算法先针对问题特征和图像特征分别使用自我注意力机制实现特征的自我加强,然后引入图像与问题双引导注意力机制,最后使用线性分类器分类输出。在VQA V2.0数据集上实验验证,该算法表现出较好的性能,准确率达到70.98%。 展开更多
关键词 视觉问答 交互推理 引导注意力机制 自我注意
下载PDF
融合人体骨架和姿势信息特征的轻量级人体动作识别方法
3
作者 王振宇 向泽锐 +2 位作者 支锦亦 叶浩航 丁铁成 《应用科技》 CAS 2024年第2期135-144,共10页
针对人体动作识别任务中特征值选取不当导致识别率低、使用多模态数据导致训练成本高等问题,提出一种轻量级人体动作识别方法。首先使用OpenPose、PoseNet提取出人体骨架信息,使用BWT69CL传感器提取姿势信息;其次对数据进行预处理、特... 针对人体动作识别任务中特征值选取不当导致识别率低、使用多模态数据导致训练成本高等问题,提出一种轻量级人体动作识别方法。首先使用OpenPose、PoseNet提取出人体骨架信息,使用BWT69CL传感器提取姿势信息;其次对数据进行预处理、特征融合,对人体动作进行深度学习分类识别;最后,为验证此方法的有效性,在公开数据集WISDM、UCIHAR、HASC和自建的人体动作数据集上进行实验验证,并使用改进的目标引导注意力机制(target-guided attention,TGA)–长短期记忆(long short term memory,LSTM)网络输出最终的分类结果。实验结果表明,在自建数据集下融合姿势和骨架特征达到99.87%准确率,相比于只使用姿势信息特征,识别准确率提高了约5.31个百分点;相比于只使用人体骨架特征,识别准确率提高了约1.87个百分点;在识别时间上相比于只使用姿势信息,识别时间降低了约29.73 s;相比于只使用人体骨架数据,识别时间降低了约9 s。使用该方法能及时有效地反映人体的运动意图,有助于提高人体动作和行为的识别准确率和训练效率。 展开更多
关键词 人体骨架 姿势信息 轻量级 人体动作识别 目标引导注意力机制 数据集 多模态 特征提取
下载PDF
新冠肺炎CT影像的DNN对抗攻击研究 被引量:2
4
作者 胡耿 蔡延光 《计算机工程与应用》 CSCD 北大核心 2022年第1期152-157,共6页
在深度学习应用于新型冠状肺炎CT智能识别的研究中,大量研究人员通过构建深度神经网络训练模型,从而理解医学影像数据内容,辅助新冠肺炎诊断。提出AMDRC-Net架构,其中的残差结构,通过恒等映射解决了网络退化问题,与此同时,针对残差结构... 在深度学习应用于新型冠状肺炎CT智能识别的研究中,大量研究人员通过构建深度神经网络训练模型,从而理解医学影像数据内容,辅助新冠肺炎诊断。提出AMDRC-Net架构,其中的残差结构,通过恒等映射解决了网络退化问题,与此同时,针对残差结构阻碍新特征探索的新问题,受到注意力机制等最新研究启发,研究了长短注意力引导机制。关注深度学习模型安全性问题,讨论基于梯度上升的对抗攻击方法;为了解决其单一性问题,通过长短注意力机制,增加有效对抗扰动的同时减少冗余扰动,紧接着,提出的对抗攻击算法A-IM-FGSM,将对抗攻击问题转化为自适应约束问题,即可微变换思想用于迭代攻击中,探究注意力引导机制与DNN对抗攻击的相互关系。最后进行的实验中,在新型冠状肺炎CT数据集上,通过AMDRC-Net进行模型训练,设计对比实验、可视化实验、对抗攻击实验。 展开更多
关键词 新冠肺炎CT影像 注意力引导机制 深度学习 DNN对抗攻击
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部