期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于VGG-Net的X射线全脊柱冠状面图像分割方法
1
作者 申学泉 张勇 +3 位作者 张润杰 石琼芳 宋宇锋 张权 《国外电子测量技术》 2024年第1期135-140,共6页
在计算机辅助脊柱图像分析和疾病诊断应用中,从X射线脊柱图像中自动分割脊柱和椎骨是一个关键且具有挑战性的问题。为进一步提升脊柱图像分割精度,提出一种基于VGG-Net改进的模型。首先,将VGG16网络去掉了后面的全连接层,用作U-Net的特... 在计算机辅助脊柱图像分析和疾病诊断应用中,从X射线脊柱图像中自动分割脊柱和椎骨是一个关键且具有挑战性的问题。为进一步提升脊柱图像分割精度,提出一种基于VGG-Net改进的模型。首先,将VGG16网络去掉了后面的全连接层,用作U-Net的特征提取网络;其次,为了增强图像的细节信息,在特征提取网络引入小波分解模块;最后,在上采样网络中设计了一种逐像素相减的自空间注意力模块(SUB-SSAM)机制,进一步提高网络模型识别关键特征的能力。实验结果表明,改进后的模型相较于原VGG-Net模型在平均交并比(mIoU)上提高了2.39%、召回率(recall)提高了0.96%、准确率(accuracy)提高了1.31%,训练的该网络模型可以定位到每一块椎骨,准确分割椎体区域。 展开更多
关键词 图像分割 U-Net vgg-net 小波分解 SUB-SSAM
下载PDF
基于VGG-Nets算法手势识别设计与实现 被引量:1
2
作者 刘欣易 孔家伟 +1 位作者 陈果然 孟祥佳 《物联网技术》 2023年第5期35-38,43,共5页
为提高正常人与聋哑人之间的交流效率,基于TensorFlow深度学习框架,采用Python、OpenCV视觉库、VGG-Nets网络模型算法,将手语的手势动作转换为文本、语音等形式,构造了正常人与聋哑人之间的无障碍交流平台。在功能上主要完成对静态手语... 为提高正常人与聋哑人之间的交流效率,基于TensorFlow深度学习框架,采用Python、OpenCV视觉库、VGG-Nets网络模型算法,将手语的手势动作转换为文本、语音等形式,构造了正常人与聋哑人之间的无障碍交流平台。在功能上主要完成对静态手语的识别,并以此为基础实现手势动作信息到文本、语音等信息的转化。本系统可以使用摄像头主动采集手语信息,也可利用前端上传图片至后台;结合手语识别的固定流程识别手语,并在前端界面反馈出识别结果。本系统旨在通过机器学习算法实现手语动作识别,并将手语翻译成文字、语音等形式,可有效提升交流效率。 展开更多
关键词 人工智能 vgg-nets网络模型 手语识别 PYTHON 人机交互 深度学习
下载PDF
基于VGG-NET的特征融合面部表情识别 被引量:16
3
作者 李校林 钮海涛 《计算机工程与科学》 CSCD 北大核心 2020年第3期500-509,共10页
为了解决在面部表情特征提取过程中卷积神经网络CNN和局部二值模式LBP只能提取面部表情图像的单一特征,难以提取与面部变化高度相关的精确特征的问题,提出了一种基于深度学习的特征融合的表情识别方法。该方法将LBP特征和CNN卷积层提取... 为了解决在面部表情特征提取过程中卷积神经网络CNN和局部二值模式LBP只能提取面部表情图像的单一特征,难以提取与面部变化高度相关的精确特征的问题,提出了一种基于深度学习的特征融合的表情识别方法。该方法将LBP特征和CNN卷积层提取的特征通过加权的方式结合在改进的VGG-16网络连接层中,最后将融合特征送入Softmax分类器获取各类特征的概率,完成基本的6种表情分类。实验结果表明,所提方法在CK+和JAFFE数据集上的平均识别准确率分别达到了97.5%和97.62%,利用融合特征得到的识别结果明显优于利用单一特征识别的效果。与其他方法相比较,该方法能有效提高表情识别准确率,对光照变化更加鲁棒。 展开更多
关键词 面部表情识别 特征融合 vgg-net网络 Softmax分类
下载PDF
基于改进的VGG-Net的手写蒙古文字元识别 被引量:3
4
作者 石佳钰 殷雁君 +1 位作者 刁明皓 智敏 《内蒙古师范大学学报(自然科学版)》 CAS 2021年第2期127-133,共7页
现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法。通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别。结果表... 现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法。通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别。结果表明,改进的VGG-Net对字元图像识别的准确率达到96.83%,相比传统VGG-Net模型识别速度更快,准确率更高,占用储存空间更少。 展开更多
关键词 蒙古文字元识别 vgg-net 数据增强
下载PDF
基于深度学习的声带疾病诊断识别方法比较研究
5
作者 邹锋 郭珊珊 樊玉琦 《现代信息科技》 2024年第8期111-114,122,共5页
在医学图像诊断领域,计算机辅助诊断技术已提升了图像诊断的准确性,但针对声带疾病的喉镜图像深度学习模型仍相对稀缺,这在一定程度上限制了声带疾病识别领域的发展。文章采用经典的VGG-Net算法和一种引入注意力机制的算法来对喉镜图像... 在医学图像诊断领域,计算机辅助诊断技术已提升了图像诊断的准确性,但针对声带疾病的喉镜图像深度学习模型仍相对稀缺,这在一定程度上限制了声带疾病识别领域的发展。文章采用经典的VGG-Net算法和一种引入注意力机制的算法来对喉镜图像进行分类。通过比较这两种算法在准确率、召回率/灵敏率和特异率方面的表现,评估它们在医学图像分类性能上的优劣。实验结果表明,引入注意力机制的SA、SE-Net、CBAM和ECA-Net算法在性能上明显优于VGG-Net算法。结合深度学习和注意力机制可显著提升声带疾病喉镜图像诊断的准确性和效率,这对未来医疗行业的健康发展有着极其重要的意义。 展开更多
关键词 医学图像诊断 声带疾病 喉镜图像 vgg-net算法 注意力机制
下载PDF
卷积神经网络在航测图像自动识别中的应用探讨
6
作者 孙健飞 王占岗 陶恩海 《现代测绘》 2023年第5期48-52,共5页
针对无人机航测影像的目标识别问题,结合目前已有相关开发语言及模型,探讨在航测内业采集过程中加入人工智能识别技术实现地物自动识别和绘制的可行性。首先,分析近年来计算机图像识别方面的人工智能模型,结合航空影像固有特性,通过研... 针对无人机航测影像的目标识别问题,结合目前已有相关开发语言及模型,探讨在航测内业采集过程中加入人工智能识别技术实现地物自动识别和绘制的可行性。首先,分析近年来计算机图像识别方面的人工智能模型,结合航空影像固有特性,通过研究识别后与已有绘图软件交互。其次,设计了一组基于经典卷积神经网络的航测影像自动识别实验。结果表明,VGG16模型能够有效提升高分辨率和复杂背景的航拍图像的识别准确率,在较小目标(如路灯等)的识别准确率较低。以此给出输入图像精细化预处理、原数据集数据增强与多次迭代、构建具有双重损失函数的糅合模型3个方面的改进措施,为后续进一步的研究确定了方向。 展开更多
关键词 卷积神经网络CNN vgg-net模型 航测 内业采集 目标检测
下载PDF
类HED网络的热红外图像显著性人体检测深度网络
7
作者 张骏 张鹏 +1 位作者 张政 白云飞 《红外技术》 CSCD 北大核心 2023年第6期649-657,共9页
热红外图像中的人体目标易于观察显著性强,应用广泛,但受限于热红外设备的硬件,往往图像中的人体目标边缘模糊,检测效果较差,同时因为热红外的特殊成像原理,人体目标检测时极易受到发热物和遮挡物的干扰,检测的精度也无法得到保证。针... 热红外图像中的人体目标易于观察显著性强,应用广泛,但受限于热红外设备的硬件,往往图像中的人体目标边缘模糊,检测效果较差,同时因为热红外的特殊成像原理,人体目标检测时极易受到发热物和遮挡物的干扰,检测的精度也无法得到保证。针对上述问题,本文提出了一种类HED(holistically nested edge detection)的热红外显著性人体检测网络。网络采用类HED网络形式,通过将不同比例的空洞卷积编解码模块进行残差相加形式,完成人体目标的检测任务。实验证明该网络可以有效地检测人体目标,准确地预测边缘结构,同时在发热物及遮挡物等环境下也具有较高的检测精度。 展开更多
关键词 HED VGG U-NET
下载PDF
基于3D卷积神经网络的肺结节检测
8
作者 黄冬云 王欣 秦斌 《湖南工业大学学报》 2023年第1期75-82,共8页
针对肺结节自动检测模型精度较低,假阳性较高等问题,提出一种基于3D卷积神经网络的两阶段肺结节检测方法。第一阶段使用3D V-Net检测出所有候选结节,并融合残差跳转连接构建深层网络,以保留上层网络一定比例输出,实现图像特征重用,引入... 针对肺结节自动检测模型精度较低,假阳性较高等问题,提出一种基于3D卷积神经网络的两阶段肺结节检测方法。第一阶段使用3D V-Net检测出所有候选结节,并融合残差跳转连接构建深层网络,以保留上层网络一定比例输出,实现图像特征重用,引入改进的损失函数解决数据集正负样本失衡的问题;第二阶段使用3D VGG网络对候选结节分类,以降低假阳性,并加入残差连接防止梯度消失和退化,以加速网络训练过程。实验结果表明,该方法在候选结节检测阶段的敏感度为91.28%,分类阶段的准确率为99.22%,敏感度为96.60%,可有效辅助放射科医生对肺结节进行检测。 展开更多
关键词 3D卷积 V-Net 肺结节检测 残差 分类 VGG
下载PDF
基于改进U-Net神经网络的人体血细胞计数
9
作者 李书铮 杨伏洲 +1 位作者 邬云熙 刘思 《电脑与电信》 2023年第12期59-65,共7页
自动血细胞计数在医学领域具有重要意义,现有传统方法在计数过程中存在一定误差。针对传统U-Net模型进行优化分别提出了Res-U-Net模型和VGG-U-Net模型,二者均提高了人体血细胞计数的精度。首先实验采集的人体血细胞图像制作成数据集,然... 自动血细胞计数在医学领域具有重要意义,现有传统方法在计数过程中存在一定误差。针对传统U-Net模型进行优化分别提出了Res-U-Net模型和VGG-U-Net模型,二者均提高了人体血细胞计数的精度。首先实验采集的人体血细胞图像制作成数据集,然后将优化模型与传统U-Net模型对比分析,实验结果表明在传统U-Net细胞计数精度为92%的基础上,Res-U-Net提升到94%,VGG-U-Net提升到95%,二者均显著提高了计数精度。实验数据很好验证了两种优化模型的有效性,为人体血细胞计数领域的自动化技术提供了新的思路。 展开更多
关键词 人体血细胞 U-Net模型 计数精度 VGG
下载PDF
基于深度神经网络的人脸图像识别 被引量:3
10
作者 王恩侃 曹玉东 汪金涛 《辽宁工业大学学报(自然科学版)》 2019年第1期29-32,共4页
概述了深度神经网络的最新进展情况,着重深入分析了VGG-Net深度神经网络模型,相比于传统学习方法,深度学习能达到更高的识别准确率,但是存在训练和测试时间较长、字典存储量偏大等问题。在不降低识别率的前提下,通过改进模型结构和优化... 概述了深度神经网络的最新进展情况,着重深入分析了VGG-Net深度神经网络模型,相比于传统学习方法,深度学习能达到更高的识别准确率,但是存在训练和测试时间较长、字典存储量偏大等问题。在不降低识别率的前提下,通过改进模型结构和优化参数,减少训练时间,实现了轻量化计算。在FaceScrub人脸图像数据集上验证了改进算法的有效性。 展开更多
关键词 深度学习 vgg-net网络 人脸图像识别
下载PDF
基于DLatLRR与VGG Net的红外与可见光图像融合 被引量:4
11
作者 沈瑜 陈小朋 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第6期1105-1114,共10页
针对红外与可见光图像融合中特征损失严重、显著目标不突出的问题,提出了一种低秩表示分解与深度神经网络相结合的图像融合算法。首先,对源图像进行潜在低秩表示分解(DLatLRR),得到相应的低秩部分、显著部分及稀疏噪声。然后,分别采用1... 针对红外与可见光图像融合中特征损失严重、显著目标不突出的问题,提出了一种低秩表示分解与深度神经网络相结合的图像融合算法。首先,对源图像进行潜在低秩表示分解(DLatLRR),得到相应的低秩部分、显著部分及稀疏噪声。然后,分别采用16层的VGG Net模型和联合特征加权算法对低秩部分与显著部分进行融合,舍弃二者的稀疏噪声。最后,对融合得到的低秩部分和显著部分进行图像重建,得到最终的融合图像。实验结果表明:与其他算法进行比较,所提算法能够对图像的深层次细节特征进行融合,突出场景中的感兴趣区域,且融合图像的相关差异和、结构相似性、线性相关度等多种客观指标均有所提升,提升最大值分别为0.73、0.15、0.11,噪声产生率的最大缩减值为0.041 2。 展开更多
关键词 图像处理 图像融合 潜在低秩表示分解(DLatLRR) VGG Net 联合特征加权
下载PDF
基于卷积神经网络风格迁移在iOS上的应用 被引量:1
12
作者 罗可昕 邢晨 《浙江水利水电学院学报》 2019年第5期67-71,共5页
图像的风格迁移在现实中有着广泛应用。VGG卷积神经网络可以快速提取抽象特征的优势,应用于图像识别和图片风格迁移。据此,采用Apple公司的Core ML框架,实现了一个在iOS上的VGG网络模型,该网络模型能够把两张图片进行风格融合,得到一张... 图像的风格迁移在现实中有着广泛应用。VGG卷积神经网络可以快速提取抽象特征的优势,应用于图像识别和图片风格迁移。据此,采用Apple公司的Core ML框架,实现了一个在iOS上的VGG网络模型,该网络模型能够把两张图片进行风格融合,得到一张风格独特的照片。相关实验测试表明,此方法能够在iOS系统的手机实现较好的风格迁移效果。 展开更多
关键词 vgg-nets 风格迁移 IOS 神经网络
下载PDF
卷积神经网络的风格迁移算法在场景处理中的应用
13
作者 黄建茂 《宜宾学院学报》 2018年第12期1-5,共5页
针对传统风格迁移算法的诸多局限性,介绍了基于卷积神经网络的风格迁移算法,通过简化算法的生成步骤,实现图片的批量生成.就卷积神经网络计算过于耗时的问题,提出将像素损失改为感知损失,从而将运行时间降低了两个数量级.
关键词 风格迁移 vgg-nets 场景处理 神经网络
下载PDF
基于深度学习的人脸识别跟随六足机器人
14
作者 张洋溢 赵茜茜 聂焱 《科技风》 2019年第14期82-82,114,共2页
本文介绍了一种基于深度学习的人脸识别算法进行人脸检测达到智能跟随的六足机器人。该机器人系统包括人脸捕捉单元、主控制单元和行为运动控制单元。所述人脸捕捉单元是利用摄像机获取人脸图像或视频并传输给机器人主控制单元。而主控... 本文介绍了一种基于深度学习的人脸识别算法进行人脸检测达到智能跟随的六足机器人。该机器人系统包括人脸捕捉单元、主控制单元和行为运动控制单元。所述人脸捕捉单元是利用摄像机获取人脸图像或视频并传输给机器人主控制单元。而主控制单元运用改进的VGG-Net人脸识别算法进行人脸检测,再根据检测结果发出信号到行为运动控制单元完成智能跟随,通过驱动直流电机实现六足机器人的运动。 展开更多
关键词 人脸识别 vgg-net 目标跟随 六足机器人
下载PDF
基于卷积神经网络模型的分层特征提取
15
作者 周丽娜 《科技风》 2018年第5期61-61,共1页
针对传统人工特征无法捕捉图像目标语义信息的缺点,本文提出一种基于卷积神经网络模型VGG-Net的分层特征提取方法,对模型的高低卷积层分别进行特征提取和深入的分析。实验结果表明低层特征图分辨率高包含更多细节信息,高层特征图分辨率... 针对传统人工特征无法捕捉图像目标语义信息的缺点,本文提出一种基于卷积神经网络模型VGG-Net的分层特征提取方法,对模型的高低卷积层分别进行特征提取和深入的分析。实验结果表明低层特征图分辨率高包含更多细节信息,高层特征图分辨率低能提取更多语义信息。因此可根据不同任务选择不同层特征以获得最佳的目标特征表达。 展开更多
关键词 特征提取 卷积神经网络 vgg-net模型 分层特征
下载PDF
基于空洞U-Net神经网络的PET图像重建算法 被引量:8
16
作者 杜倩倩 强彦 +1 位作者 李硕 杨晓棠 《太原理工大学学报》 CAS 北大核心 2020年第2期190-197,共8页
为了提高PET重建的图像质量,提出一种基于空洞U-Net神经网络(Dilated U-Net,D-Unet)的PET图像重建方法。首先,在不增加参数量的情况下,为了更好地增强上下文语义信息,提取更深层次的图像特征,设计了嵌套空洞卷积的残差块(residual dense... 为了提高PET重建的图像质量,提出一种基于空洞U-Net神经网络(Dilated U-Net,D-Unet)的PET图像重建方法。首先,在不增加参数量的情况下,为了更好地增强上下文语义信息,提取更深层次的图像特征,设计了嵌套空洞卷积的残差块(residual dense blocks nested with dilations,RnD Blocks)对含有径向条纹伪影和高噪声的图像进行处理。另外,结合基于预先训练的VGG网络特征的感知损失代替传统的均方误差作为训练损失函数来保留图像细节,构建了端到端的PET图像重构网络。实验结果表明,该算法在降低复杂性、保持较高收敛速度的同时,能够更好地抑制噪声,重构效果相比于传统方法有明显提高。 展开更多
关键词 图像重建 空洞卷积 U-Net 感知损失 PET VGG
下载PDF
基于双域多阶段联合降噪的低剂量CT图像重建
17
作者 王艳飞 强彦 +1 位作者 王梦南 张振庆 《太原理工大学学报》 CAS 北大核心 2022年第2期266-273,共8页
针对计算机断层成像中辐射剂量的暴露具有癌症诱发的潜在危险,以及单一数据在重建结果中易产生噪声残留、结构过度平滑等问题,提出基于两种不同数据域的低剂量CT图像多阶段联合降噪模型。在生成器第一阶段对低剂量投影数据采用残差U-Ne... 针对计算机断层成像中辐射剂量的暴露具有癌症诱发的潜在危险,以及单一数据在重建结果中易产生噪声残留、结构过度平滑等问题,提出基于两种不同数据域的低剂量CT图像多阶段联合降噪模型。在生成器第一阶段对低剂量投影数据采用残差U-Net模型进行正弦图恢复,在编解码过程通过嵌入跳跃连接为上采样增加多尺度信息,加快训练收敛速度。对去噪后投影图像用滤波反投影实现频域到空间域转换。在第二阶段利用多尺度卷积对CT重建图像再次去噪,丰富卷积多样性,提高重构精度。此外引入VGG网络捕获不同剂量图像间的感知差异,提高网络表征能力。实验结果表明,该方法获得了较高PSNR,相较于单一域变换,更能有效地利用投影数据与图像数据的互补效应来抑制噪声和伪影,提高重构效果。 展开更多
关键词 低剂量 多阶段 残差U-net 多尺度卷积 VGG网络
下载PDF
Video-Based Face Recognition with New Classifiers
18
作者 Soniya Singhal Madasu Hanmandlu Shantaram Vasikarla 《Journal of Modern Physics》 2021年第3期361-379,共19页
An exhaustive study has been conducted on face videos from YouTube video dataset for real time face recognition using the features from deep learning architectures and also the information set features. Our objective ... An exhaustive study has been conducted on face videos from YouTube video dataset for real time face recognition using the features from deep learning architectures and also the information set features. Our objective is to cash in on a plethora of deep learning architectures and information set features. The deep learning architectures dig in features from several layers of convolution and max-pooling layers though a placement of these layers is architecture dependent. On the other hand, the information set features depend on the entropy function for the generation of features. A comparative study of deep learning and information set features is made using the well-known classifiers in addition to developing Constrained Hanman Transform (CHT) and Weighted Hanman Transform (WHT) classifiers. It is demonstrated that information set features and deep learning features have comparable performance. However, sigmoid-based information set features using the new classifiers are found to outperform MobileNet features. 展开更多
关键词 Face Recognition on Videos Information Sets Constrained Hanman Transform Classifier Weighted Hanman Transform Classifier Video Face Dataset MobileNet Vgg-16 Inception Net ResNet
下载PDF
基于机器学习的精准定位系统
19
作者 刘毅 胡宗群 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期33-39,共7页
针对开阔空间中移动目标的定位技术,如卫星定位技术,存在的易受环境影响、定位误差较大的问题,以及室内定位技术,如超声波、WiFi网络和无线传感器网络等,存在的灵活度较低、成本较高的问题,提出一种基于机器学习的精准定位系统(PPS-ML)... 针对开阔空间中移动目标的定位技术,如卫星定位技术,存在的易受环境影响、定位误差较大的问题,以及室内定位技术,如超声波、WiFi网络和无线传感器网络等,存在的灵活度较低、成本较高的问题,提出一种基于机器学习的精准定位系统(PPS-ML).该系统包括实景GIS(地理信息系统)服务器、图像训练服务器、定位服务器和无线摄像机,其中:实景GIS服务器存储设定空间内的三维地理信息和与之对应的实景图像库;图像训练服务器通过改进后的VGG-Net进行区域机器学习,训练图像分类器,并生成位置识别模型,传入定位服务器;定位服务器通过卫星定位系统粗略定位目标所在区域,然后根据该区域的位置识别模型对无线摄像机采集的图像进行识别,实现精准定位.结果表明:该系统达到了室内1.5 m和室外3 m的定位精度,且能实现8个方向的识别. 展开更多
关键词 机器学习 图像分类 vgg-net 精准定位 室内定位
原文传递
改进U-Net模型的A356合金铸造轮毂内部缺陷检测
20
作者 张俊生 赫英凤 +1 位作者 杨鹏 仝晓刚 《特种铸造及有色合金》 CAS 北大核心 2023年第7期959-962,共4页
A356合金轮毂在低压铸造生产过程中,容易出现气孔、缩孔等内部缺陷,需要使用X射线无损探伤设备来检测。轮毂X射线检测的核心问题是缺陷自动判定,引入深度卷积神经网络中的U-Net模型作为框架,结合VGG模型改进编码器和解码器,在构建的数... A356合金轮毂在低压铸造生产过程中,容易出现气孔、缩孔等内部缺陷,需要使用X射线无损探伤设备来检测。轮毂X射线检测的核心问题是缺陷自动判定,引入深度卷积神经网络中的U-Net模型作为框架,结合VGG模型改进编码器和解码器,在构建的数据库上展开缺陷自动识别研究。在准确定义轮毂缺陷检测识别率、误判率和漏判率的基础上,发现改进U-Net模型的性能与原始U-Net模型相比明显提升,缺陷识别率达到96.15%,满足实际检测需求。 展开更多
关键词 A356合金轮毂 X射线 缺陷检测 U-Net模型 VGG模型
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部