期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进ResNet-50与迁移学习的苹果叶片病害的图像识别
1
作者 李韬 朱文忠 车璇 《科学技术与工程》 北大核心 2024年第24期10370-10381,共12页
为解决下述问题,在自然场景中获取的苹果叶病害图像大多包含复杂的背景,同时,由于拍摄要求不那么严格,疾病特征更有可能出现在图像中的任意位置,所有这些因素都会影响卷积神经网络的识别精度,且随着网络加深其性能提升困难。提出了一种... 为解决下述问题,在自然场景中获取的苹果叶病害图像大多包含复杂的背景,同时,由于拍摄要求不那么严格,疾病特征更有可能出现在图像中的任意位置,所有这些因素都会影响卷积神经网络的识别精度,且随着网络加深其性能提升困难。提出了一种基于改进ResNet-50的苹果叶片病害识别方法。首先引入SE(squeeze-and-excitation)注意力机制,改进残差模块,在一定程度上去除复杂背景等干扰信息,另一方面降低模型对特征定位的过度敏感度,使模型能够学习更重要的疾病特征,减少复杂背景等信息的干扰,然后加入Dropout层抑制过拟合改进模型结构,最后采用迁移学习的训练方式加快模型的收敛速度。在苹果叶病数据集上的实验结果表明,改进模型的准确率达到98.35%,较ResNet-50提高5%。与其他一些传统的卷积神经网络相比,该模型收敛速度更快,具有更高的识别精度,能够较好地识别苹果叶片病害,适用于自然场景下获取的苹果叶病图像等优点,具有较强的实用性。 展开更多
关键词 resnet-50 迁移学习 苹果叶片病害 SE(squeeze-and-excitation)注意力机制
下载PDF
基于ResNet-50的珍珠龙胆石斑鱼饱食程度分析研究
2
作者 董延彬 赵世龙 +1 位作者 王俣晴 刘鹰 《江西农业》 2024年第16期133-135,共3页
鱼类养殖生产中,饲料成本占养殖成本的40%以上,目前多采用人工对养殖鱼类进行饵料投喂,该方法依赖于养殖人员经验,无法精确控制饵料的投喂量,易导致饲料浪费和环境污染。文章首先以珍珠龙胆石斑鱼为实验对象,提出了鱼群摄食饱食程度分... 鱼类养殖生产中,饲料成本占养殖成本的40%以上,目前多采用人工对养殖鱼类进行饵料投喂,该方法依赖于养殖人员经验,无法精确控制饵料的投喂量,易导致饲料浪费和环境污染。文章首先以珍珠龙胆石斑鱼为实验对象,提出了鱼群摄食饱食程度分析方法,通过实验设计了一种新的投喂策略并用于数据集采集;其次,在ResNet-50网络模型的基础上,使用摄食定量分析数据集,验证模型能够根据不同投喂次数下的摄食强度来判断其当前的饱食程度;最后,基于摄食强度的养殖鱼类摄食定量分析,以93.8%的准确度,将饱食程度区分为20%、40%、60%、80%和100%。该研究成果有助于提高水产养殖的经济效益和鱼类生长速度,为科学养殖策略提供技术支持,为工厂化养殖的生产实践提供了参考。 展开更多
关键词 珍珠龙胆石斑鱼 resnet-50 摄食定量
下载PDF
基于ResNet-50深度卷积网络的果树病害智能诊断模型研究 被引量:10
3
作者 金瑛 叶飒 李洪磊 《农业图书情报学报》 2021年第4期58-67,共10页
[目的/意义]果树病害危及农业生产安全,运用人工智能技术帮助果农及时准确地识别果树病害对保障农业安全生产具有重要意义。[方法/过程]采用10000张果树叶片病斑图像数据集,通过旋转、污化、增噪、切割等图像增强手段,提高样本图像的多... [目的/意义]果树病害危及农业生产安全,运用人工智能技术帮助果农及时准确地识别果树病害对保障农业安全生产具有重要意义。[方法/过程]采用10000张果树叶片病斑图像数据集,通过旋转、污化、增噪、切割等图像增强手段,提高样本图像的多样性;使用ResNet-50深度卷积网络模型,进行机器学习,获得果树病害识别模型,并基于此模型开发了应用软件提供在线诊断服务。[结果/结论]实验结果表明:该模型对4种果树病害的平均识别率达到92.9%,和相关研究成果相比具有较好的诊断效果。 展开更多
关键词 resnet-50 图像识别 果树疾病 智能诊断
下载PDF
基于SE-B-ResNet-50的声纹识别方法研究
4
作者 李林 张程 《新一代信息技术》 2023年第17期1-7,共7页
针对传统声纹识别方法识别率低、方法实现过程繁琐复杂等问题,本文提出了一种基于SE-B-ResNet-50的声纹识别方法。该方法以ResNet-50为基础模型,首先结合声纹特征对模型第一层进行优化,同时在模型第一层与其他层之间增加了全局性跨尺度... 针对传统声纹识别方法识别率低、方法实现过程繁琐复杂等问题,本文提出了一种基于SE-B-ResNet-50的声纹识别方法。该方法以ResNet-50为基础模型,首先结合声纹特征对模型第一层进行优化,同时在模型第一层与其他层之间增加了全局性跨尺度连接,然后在该模型基础上融入SE-Net方法,利用对网络中的特征通道建立依赖,并利用全局信息来增强有用特征,同时抑制无用特征,通过B-ResNet和SE-Net结合的特征提取方法获得深度声纹特征。实验结果表明,采用SE-B-ResNet-50的声纹识别方法的识别准确率达到了97%以上,远高于基线方法ResNet-50。 展开更多
关键词 声纹识别 resnet-50 SE-Net SE-B-resnet-50
下载PDF
基于改进ResNet-50残差网络的纤维分类方法 被引量:8
5
作者 黄烜 孙晗 +2 位作者 林博生 殷明骏 杨志军 《西安工程大学学报》 CAS 2022年第4期19-25,共7页
针对目前常见的纤维分类技术中,分类结果受人的主观影响大、检测设备昂贵、检测时间长等问题,提出一种基于ImageNet数据集预训练的改进ResNet-50残差神经网络分类方法,并对4种纤维结构较相似的动物毛发纤维进行分类。使用自建训练集和... 针对目前常见的纤维分类技术中,分类结果受人的主观影响大、检测设备昂贵、检测时间长等问题,提出一种基于ImageNet数据集预训练的改进ResNet-50残差神经网络分类方法,并对4种纤维结构较相似的动物毛发纤维进行分类。使用自建训练集和测试集,以TensorFlow和Keras为框架,利用ResNet-50和VGG-16的基础模型进行验证;再通过加入Dropout层和数据增强策略等方式,改进ResNet-50的网络结构和参数并重新训练;最后使用测试集进行评估,得到新网络模型在测试集上的混淆矩阵并对比各项性能指标。结果表明,改进后的ResNet-50网络模型平均准确率98.88%,综合评估分数98.88%,有更优的综合分类性能。 展开更多
关键词 纤维分类 残差神经网络 resnet-50 VGG-16 迁移学习
下载PDF
基于ResNet-50改进的Faster R-CNN手势识别算法 被引量:10
6
作者 熊才华 巩言丽 +1 位作者 廉华 侯枘辰 《计算机时代》 2019年第9期1-4,共4页
为了解决不同识别环境下光照强度的变化对手势识别准确率影响的问题,提出了基于ResNet-50残差网络的改进Faster R-CNN手势识别算法。相较于普通的Faster R-CNN算法,该算法用了ResNet-50网络,提高网络特征的学习能力,并在ResNet-50中加... 为了解决不同识别环境下光照强度的变化对手势识别准确率影响的问题,提出了基于ResNet-50残差网络的改进Faster R-CNN手势识别算法。相较于普通的Faster R-CNN算法,该算法用了ResNet-50网络,提高网络特征的学习能力,并在ResNet-50中加入了实例批处理标准化(IBN)方法用于对单个图片的表征内容学习,适应不同的识别环境。实验结果表明,该算法在测试集上的识别率高达98.7%,相较于常用手势识别算法,有效性更高,鲁棒性更好。 展开更多
关键词 手势识别 FASTER R-CNN resnet-50 实例批处理标准化
下载PDF
基于ResNet-50垃圾分类算法的改进及应用 被引量:3
7
作者 王超 万兆江 +1 位作者 周瑜杰 刘雨衡 《智能计算机与应用》 2022年第10期184-188,共5页
随着人们生活水平和消费水平的不断提高,垃圾问题日益严峻。针对当前垃圾分类易出错、准确率低等问题,本文提出了一种改进的ResNet-50识别算法,首先通过二维Gamma函数对图像进行光照校正预处理;然后,采用Leaky ReLU激活函数,并把激活函... 随着人们生活水平和消费水平的不断提高,垃圾问题日益严峻。针对当前垃圾分类易出错、准确率低等问题,本文提出了一种改进的ResNet-50识别算法,首先通过二维Gamma函数对图像进行光照校正预处理;然后,采用Leaky ReLU激活函数,并把激活函数和BatchNormalize层的位置放在了卷积神经网络的卷积操作之前,优化了ResNet-50网络结构。最后,收集常见的4种类型垃圾进行训练、测试得到最优网络模型。经实验验证,该模型的准确率达到99%,识别效果较佳。为营造共建共享氛围,实现垃圾快速有效分类,推动绿色生活方式提供了理论依据。 展开更多
关键词 垃圾分类 resnet-50 卷积神经网络 Leaky ReLU BatchNormalize
下载PDF
Secure Digital Image Watermarking Technique Based on ResNet-50 Architecture
8
作者 Satya Narayan Das Mrutyunjaya Panda 《Intelligent Automation & Soft Computing》 2024年第6期1073-1100,共28页
In today’s world of massive data and interconnected networks,it’s crucial to burgeon a secure and efficient digital watermarking method to protect the copyrights of digital content.Existing research primarily focuse... In today’s world of massive data and interconnected networks,it’s crucial to burgeon a secure and efficient digital watermarking method to protect the copyrights of digital content.Existing research primarily focuses on deep learning-based approaches to improve the quality of watermarked images,but they have some flaws.To overcome this,the deep learning digital image watermarking model with highly secure algorithms is proposed to secure the digital image.Recently,quantum logistic maps,which combine the concept of quantum computing with traditional techniques,have been considered a niche and promising area of research that has attracted researchers’attention to further research in digital watermarking.This research uses the chaotic behaviour of the quantum logistic map with Rivest–Shamir–Adleman(RSA)and Secure Hash(SHA-3)algorithms for a robust watermark embedding process,where a watermark is embedded into the host image.This way,the quantum chaos method not only helps limit the chance of tampering with the image content through reverse engineering but also assists in maintaining a high level of imperceptibility and strong robustness with efficient extraction or detection of watermark images.Lifting Wavelet Transformation(LWT)is a potential and computationally efficient version of traditional Discrete Wavelet Transform(DWT)where the host image is divided into four sub-bands to offer a multi-resolution view of an image with greater flexibility in watermarking methodologies.Furthermore,considering the robustness against attacks,a pre-trained Residual Neural Network(ResNet-50),a convolutional neural network with 50 layers deep,is used to better learn the complex features and efficiently extract the watermark from the image.By integrating RSA and SHA-3 algorithms,the proposed model demonstrates improved imperceptibility,robustness,and accuracy in watermark extraction compared to traditional methods.It achieves a Peak Signal-to-Noise Ratio(PSNR)of 49.83%,a Structural Similarity Index Measure(SSIM)of 0.98,and a Number of Pixels Change Rate(NPCR)of 99.79%,respectively.These results reflect the model’s effectiveness in delivering superior quality and security.Consequently,our proposed approach offers accurate results,exceptional invisibility,and enhanced robustness compared to the existing digital image watermarking techniques. 展开更多
关键词 Image watermarking quantum logistics Rivest-Shamir-Adleman(RSA) Secure Hash(SHA-3) Lifting Wavelet Transformation(LWT) resnet-50 deep learning secure communication
下载PDF
基于Se-ResNet50特征编码器的公共环境图像描述生成 被引量:6
9
作者 唐渔 何志琴 +2 位作者 周宇辉 吴钦木 王霄 《计算机应用研究》 CSCD 北大核心 2023年第6期1864-1869,共6页
针对传统公共环境图像描述模型中编码器—解码器结构在编码过程中特征提取能力不足以及解码过程中上下文信息丢失严重的问题,提出了一种基于Se-ResNet50与M-LSTM的公共环境图像描述模型。将SeNet模块添加到ResNet-50的残差路径中得到改... 针对传统公共环境图像描述模型中编码器—解码器结构在编码过程中特征提取能力不足以及解码过程中上下文信息丢失严重的问题,提出了一种基于Se-ResNet50与M-LSTM的公共环境图像描述模型。将SeNet模块添加到ResNet-50的残差路径中得到改进残差网络提取图像特征,SeNet对特征的各个部分赋予权重生成不同的注意力特征图,再融合文本特征向量输入具有额外门控运算的改进长短期记忆网络(M-LSTM)训练。模型训练结束后,输入公共环境图像就能得到描述图像内容的自然语句。该模型在多种数据集上进行了评估,实验结果表明,提出的模型在MSCOCO数据集上相较传统模型,在BLEU-1、BLEU-2、BLEU-3、BLEU-4、METEOR、CIDEr等评价指标上分别提高了3.2%、2.1%、1.7%、1.7%、1.3%、8.2%,证明了提出的方法在评价指标、语义多样性上具有一定的优越性。 展开更多
关键词 公共环境图像描述 SeNet resnet-50 长短期记忆网络
下载PDF
一种融合多尺度技术和并行网络的DR检测方法
10
作者 陈宇 徐仕豹 《哈尔滨理工大学学报》 CAS 北大核心 2024年第1期87-95,共9页
针对糖尿病视网膜病变(DR)检测模型在下采样过程中关键信息丢失和模型鲁棒性差的问题,构建一个PM-Net模型(Parallel Multi-scale Network)。在下采样过程中,利用信息增强的方式设计了多尺度最大池化和多尺度卷积模块并对ResNet-50改进... 针对糖尿病视网膜病变(DR)检测模型在下采样过程中关键信息丢失和模型鲁棒性差的问题,构建一个PM-Net模型(Parallel Multi-scale Network)。在下采样过程中,利用信息增强的方式设计了多尺度最大池化和多尺度卷积模块并对ResNet-50改进。进一步,为了提高模型的鲁棒性,使用双分支的架构对模型进行扩展。提出的多尺度模块使得模型在下采样的过程中获得了更加丰富的视网膜眼底图像特征,从而提高了DR检测的性能,同时提出的双分支模型在DR检测过程中用局部信息辅助全局信息保证了模型的鲁棒性。模型在EyePACS、DDR和私有数据集进行了实验验证。实验结果表明:与主流的模型相比,本模型在EyePACS数据集上的准确率和二次加权Kappa分数分别提高了2.58%和1.31%。 展开更多
关键词 糖尿病视网膜病变 多尺度 并行网络 最大池化 resnet-50
下载PDF
基于ResNet50-SSD的安全帽佩戴状态检测研究 被引量:6
11
作者 岳诗琴 张乾 +2 位作者 邵定琴 范玉 白金华 《长江信息通信》 2021年第3期86-89,共4页
针对现存的安全帽佩戴检测方法对尺寸大小不一、部分遮挡的目标检测难度大的问题。文章提出了一种基于Res-Net50-SSD的安全帽佩戴状态检测研究方法。该模型以SSD网络作为基础,采用ResNet-50代替传统的VGG-16作为SSD的主干网络提取特征,... 针对现存的安全帽佩戴检测方法对尺寸大小不一、部分遮挡的目标检测难度大的问题。文章提出了一种基于Res-Net50-SSD的安全帽佩戴状态检测研究方法。该模型以SSD网络作为基础,采用ResNet-50代替传统的VGG-16作为SSD的主干网络提取特征,并在附加层中引入BN(Batch Normalization)层,加快网络的收敛速度,提高检测精确度。实验结果表明:ResNet50-SSD的在安全帽佩戴状态检测任务中mAP达80.4%,相对于传统的SSD提高了2.23%。在保证较高的检测准确率的情况下能达到了每秒35帧的检测速度,满足实时检测的要求。 展开更多
关键词 安全帽佩戴检测 SSD Res Net-50 Batch Normalization 实时检测
下载PDF
一种面向鱼眼图像的行人检测算法
12
作者 张瑶 刘发炳 +3 位作者 黄国勇 钱俊兵 阮爱国 沈忠明 《现代电子技术》 北大核心 2024年第15期40-46,共7页
鱼眼镜头非线性光学畸变导致鱼眼图像行人检测算法精度低,且校正算法也无法完全克服鱼眼图像的边缘严重变形。针对上述问题,文中以Faster R-CNN架构为基础,建立了鱼眼图像校正光路模型。针对鱼眼图像畸变,提出一种基于微分方程的鱼眼图... 鱼眼镜头非线性光学畸变导致鱼眼图像行人检测算法精度低,且校正算法也无法完全克服鱼眼图像的边缘严重变形。针对上述问题,文中以Faster R-CNN架构为基础,建立了鱼眼图像校正光路模型。针对鱼眼图像畸变,提出一种基于微分方程的鱼眼图像校正模型,并提出一种改进算法用于鱼眼图像的行人检测。构建了ResNet 50融合特征金字塔网络结构,以增强网络的多尺度特征提取能力,提高网络对行人小目标的定位和识别能力;优化平滑L1损失函数解决大梯度难学样本与小梯度易学样本间的不平衡问题,提高训练效果。实验结果表明,文中算法与现有鱼眼图像行人检测算法相比,检测精度提高了39.68%。在边缘轻微畸变及小尺度行人的检测精度可以达到90%以上,有助于提高极端条件下鱼眼图像的行人检测性能。 展开更多
关键词 鱼眼镜头 鱼眼图像 畸变校正 行人检测 Faster R-CNN ResNet 50
下载PDF
基于深度学习的农作物病虫害图像识别方法 被引量:2
13
作者 崔梦银 邓茵 崔盼盼 《沧州师范学院学报》 2024年第1期15-21,共7页
针对农作物病虫害图像识别精度和效率低的问题,提出一种基于卷积神经网络和迁移学习的多粒度特征分割模型(MGFSM).模型采用ResNet-50作为骨干网络,利用预训练权重进行参数共享,以提高识别精度和稳定性.MGFSM包含全局分支和局部分支,全... 针对农作物病虫害图像识别精度和效率低的问题,提出一种基于卷积神经网络和迁移学习的多粒度特征分割模型(MGFSM).模型采用ResNet-50作为骨干网络,利用预训练权重进行参数共享,以提高识别精度和稳定性.MGFSM包含全局分支和局部分支,全局分支学习整个图像的外观模型,局部分支解决复杂背景和遮挡问题.同时,联合使用度量损失和分类损失函数,以克服类内间距大和类间间距小的问题,提高病虫害图像辨别性.通过迁移学习,将知识迁移到增强后的目标数据上,增强模型对不同病虫害种类的适应性.实验结果表明,MGFSM模型在PlantVillage数据集上具有较高的识别精度和泛化能力,可应用于移动端和嵌入式设备中,具有一定的实用价值. 展开更多
关键词 图像识别 卷积神经网络 resnet-50 损失函数 迁移学习
下载PDF
基于神经网络的古生物化石颗粒特征鉴定
14
作者 李松林 朱章雄 +2 位作者 吴承熹 郑堃玲 李鹏飞 《中文科技期刊数据库(全文版)自然科学》 2024年第1期0079-0082,共4页
随着大数据技术的发展,古生物化石颗粒特征[footnoteRef:0]的识别和分析成为古生物学研究的重要内容之一。传统的方法需要专业人员进行人工鉴定,费时费力且存在主观的误差和人才缺乏等问题。本文提出了一种基于卷积神经网络的古生物化... 随着大数据技术的发展,古生物化石颗粒特征[footnoteRef:0]的识别和分析成为古生物学研究的重要内容之一。传统的方法需要专业人员进行人工鉴定,费时费力且存在主观的误差和人才缺乏等问题。本文提出了一种基于卷积神经网络的古生物化石颗粒特征识别方法,采用Resnet-50算法模型对图像进行预处理、模型设计、训练与预测,实现了多类生物化石的智能识别。实验结果表明,该方法对三叶虫纲和头足纲的识别准确率分别达到86.4%和91.2%,并且通过迁移学习得到的最终分类模型在数据集上的测试准确率为85.6%。该方法具有较高的准确率和效率,为古生物学的研究提供了有力支持。 展开更多
关键词 古生物化石图像 resnet-50 特征识别 卷积神经网络
下载PDF
U-Net Inspired Deep Neural Network-Based Smoke Plume Detection in Satellite Images
15
作者 Ananthakrishnan Balasundaram Ayesha Shaik +1 位作者 Japmann Kaur Banga Aman Kumar Singh 《Computers, Materials & Continua》 SCIE EI 2024年第4期779-799,共21页
Industrial activities, through the human-induced release of Green House Gas (GHG) emissions, have beenidentified as the primary cause of global warming. Accurate and quantitative monitoring of these emissions isessent... Industrial activities, through the human-induced release of Green House Gas (GHG) emissions, have beenidentified as the primary cause of global warming. Accurate and quantitative monitoring of these emissions isessential for a comprehensive understanding of their impact on the Earth’s climate and for effectively enforcingemission regulations at a large scale. This work examines the feasibility of detecting and quantifying industrialsmoke plumes using freely accessible geo-satellite imagery. The existing systemhas so many lagging factors such aslimitations in accuracy, robustness, and efficiency and these factors hinder the effectiveness in supporting timelyresponse to industrial fires. In this work, the utilization of grayscale images is done instead of traditional colorimages for smoke plume detection. The dataset was trained through a ResNet-50 model for classification and aU-Net model for segmentation. The dataset consists of images gathered by European Space Agency’s Sentinel-2 satellite constellation from a selection of industrial sites. The acquired images predominantly capture scenesof industrial locations, some of which exhibit active smoke plume emissions. The performance of the abovementionedtechniques and models is represented by their accuracy and IOU (Intersection-over-Union) metric.The images are first trained on the basic RGB images where their respective classification using the ResNet-50model results in an accuracy of 94.4% and segmentation using the U-Net Model with an IOU metric of 0.5 andaccuracy of 94% which leads to the detection of exact patches where the smoke plume has occurred. This work hastrained the classification model on grayscale images achieving a good increase in accuracy of 96.4%. 展开更多
关键词 Smoke plume resnet-50 U-Net geo satellite images early warning global monitoring
下载PDF
Enhancing Skin Cancer Diagnosis with Deep Learning:A Hybrid CNN-RNN Approach
16
作者 Syeda Shamaila Zareen Guangmin Sun +2 位作者 Mahwish Kundi Syed Furqan Qadri Salman Qadri 《Computers, Materials & Continua》 SCIE EI 2024年第4期1497-1519,共23页
Skin cancer diagnosis is difficult due to lesion presentation variability. Conventionalmethods struggle to manuallyextract features and capture lesions spatial and temporal variations. This study introduces a deep lea... Skin cancer diagnosis is difficult due to lesion presentation variability. Conventionalmethods struggle to manuallyextract features and capture lesions spatial and temporal variations. This study introduces a deep learning-basedConvolutional and Recurrent Neural Network (CNN-RNN) model with a ResNet-50 architecture which usedas the feature extractor to enhance skin cancer classification. Leveraging synergistic spatial feature extractionand temporal sequence learning, the model demonstrates robust performance on a dataset of 9000 skin lesionphotos from nine cancer types. Using pre-trained ResNet-50 for spatial data extraction and Long Short-TermMemory (LSTM) for temporal dependencies, the model achieves a high average recognition accuracy, surpassingprevious methods. The comprehensive evaluation, including accuracy, precision, recall, and F1-score, underscoresthe model’s competence in categorizing skin cancer types. This research contributes a sophisticated model andvaluable guidance for deep learning-based diagnostics, also this model excels in overcoming spatial and temporalcomplexities, offering a sophisticated solution for dermatological diagnostics research. 展开更多
关键词 Skin cancer classification deep learning Convolutional Neural Network(CNN) RNN resnet-50
下载PDF
Posture Detection of Heart Disease Using Multi-Head Attention Vision Hybrid(MHAVH)Model
17
作者 Hina Naz Zuping Zhang +3 位作者 Mohammed Al-Habib Fuad A.Awwad Emad A.A.Ismail Zaid Ali Khan 《Computers, Materials & Continua》 SCIE EI 2024年第5期2673-2696,共24页
Cardiovascular disease is the leading cause of death globally.This disease causes loss of heart muscles and is also responsible for the death of heart cells,sometimes damaging their functionality.A person’s life may ... Cardiovascular disease is the leading cause of death globally.This disease causes loss of heart muscles and is also responsible for the death of heart cells,sometimes damaging their functionality.A person’s life may depend on receiving timely assistance as soon as possible.Thus,minimizing the death ratio can be achieved by early detection of heart attack(HA)symptoms.In the United States alone,an estimated 610,000 people die fromheart attacks each year,accounting for one in every four fatalities.However,by identifying and reporting heart attack symptoms early on,it is possible to reduce damage and save many lives significantly.Our objective is to devise an algorithm aimed at helping individuals,particularly elderly individuals living independently,to safeguard their lives.To address these challenges,we employ deep learning techniques.We have utilized a vision transformer(ViT)to address this problem.However,it has a significant overhead cost due to its memory consumption and computational complexity because of scaling dot-product attention.Also,since transformer performance typically relies on large-scale or adequate data,adapting ViT for smaller datasets is more challenging.In response,we propose a three-in-one steam model,theMulti-Head Attention Vision Hybrid(MHAVH).Thismodel integrates a real-time posture recognition framework to identify chest pain postures indicative of heart attacks using transfer learning techniques,such as ResNet-50 and VGG-16,renowned for their robust feature extraction capabilities.By incorporatingmultiple heads into the vision transformer to generate additional metrics and enhance heart-detection capabilities,we leverage a 2019 posture-based dataset comprising RGB images,a novel creation by the author that marks the first dataset tailored for posture-based heart attack detection.Given the limited online data availability,we segmented this dataset into gender categories(male and female)and conducted testing on both segmented and original datasets.The training accuracy of our model reached an impressive 99.77%.Upon testing,the accuracy for male and female datasets was recorded at 92.87%and 75.47%,respectively.The combined dataset accuracy is 93.96%,showcasing a commendable performance overall.Our proposed approach demonstrates versatility in accommodating small and large datasets,offering promising prospects for real-world applications. 展开更多
关键词 Image analysis posture of heart attack(PHA)detection hybrid features VGG-16 resnet-50 vision transformer advance multi-head attention layer
下载PDF
基于改进DeepLabCut模型的奶牛滑蹄检测方法
18
作者 年悦 赵凯旋 姬江涛 《智慧农业(中英文)》 CSCD 2024年第5期153-163,共11页
[目的/意义]为解决奶牛在行走过程中出现滑蹄姿态无法自动识别检测的问题,基于深度学习的方法对奶牛身体关键点进行定位分析,实现对奶牛滑蹄姿态的自动检测。[方法]选取奶牛四蹄及头部作为奶牛身体关键点,基于DeepLabCut(DLC)对奶牛四... [目的/意义]为解决奶牛在行走过程中出现滑蹄姿态无法自动识别检测的问题,基于深度学习的方法对奶牛身体关键点进行定位分析,实现对奶牛滑蹄姿态的自动检测。[方法]选取奶牛四蹄及头部作为奶牛身体关键点,基于DeepLabCut(DLC)对奶牛四蹄及头部关键点进行定位,首先选取ResNet系列、MobileNet-V2系列、EfficientNet系列等10个网络模型替换DLC的主干网络,最终选取准确率最高的ResNet-50作为DLC的主干网络,随后选择轻量级的卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入ResNet-50的网络结构中,完成对ResNet-50网络模型的改进。通过改进后的模型得到奶牛身体关键点坐标,绘制奶牛四蹄及头部运动曲线。利用奶牛身体关键点运动曲线进行分析,提取奶牛滑蹄姿态的特征参数Feature1、奶牛滑蹄距离的特征参数Feature2。基于决策树对提取的奶牛滑蹄姿态特征参数进行模型的训练和验证。利用提取的奶牛滑蹄特征参数对奶牛的滑蹄距离进行计算,同时人工对奶牛滑蹄距离进行标定,与预测的滑蹄距离进行比较。[结果和讨论]改进后的ResNet-50网络相较于ResNet-50在验证集的定位准确率提高了9.7%,相较于YOLOv8s-pose的定位精准度提高了1.06 pixels,与手动标识的身体关键点之间的均方根误差(Root Mean Square Error,RMSE)仅为2.99 pixels。采用10折交叉验证对奶牛滑蹄检测模型的效果进行评估,结果表明,该模型的平均准确率、精确度、召回率和F1分数分别为90.42%,0.943,0.949和0.941。基于特征参数Feature2计算的奶牛滑蹄距离与人工标定奶牛滑蹄距离的RMSE仅为1.363 pixels。[结论]融合CBAM模块改进的ResNet-50网络模型对奶牛身体关键点定位的准确率较高,基于滑蹄判断特征参数Feature1和滑蹄距离检测特征参数Feature2建立的奶牛滑蹄判断模型和奶牛滑蹄距离预测模型与人工检测的结果相比,都有较小的误差,这表明该方法有较好的准确性,可以为奶牛滑蹄自动检测工作提供技术支持。 展开更多
关键词 深度学习 奶牛滑蹄 resnet-50 决策树 CBAM注意力机制 决策树
下载PDF
基于视觉分析的垃圾分类识别系统的设计与实现
19
作者 黄明宇 曹一鹏 +1 位作者 佟英芝 于佳弘 《物联网技术》 2024年第9期25-27,共3页
随着垃圾产生量的不断上升、环境的持续恶化,如今垃圾分类已经成为必要的管理措施。为了实现垃圾自动识别、分类和投放,详细探讨了垃圾分类系统的设计与实现。选择Jetson Nano作为主控硬件,以神经网络模型ResNet-50作为识别模型,使用大... 随着垃圾产生量的不断上升、环境的持续恶化,如今垃圾分类已经成为必要的管理措施。为了实现垃圾自动识别、分类和投放,详细探讨了垃圾分类系统的设计与实现。选择Jetson Nano作为主控硬件,以神经网络模型ResNet-50作为识别模型,使用大量数据集进行深度学习训练,从而实现垃圾的自动识别与分类。系统还搭载了一组舵机并配合机械臂实现垃圾的自动投放。通过测试发现:所设计系统的分类速度快、识别准确率高,可为日常生活中的垃圾分类处理提供更多的便利。 展开更多
关键词 视觉分析 垃圾分类 resnet-50 JetsonNano 深度学习 神经网络
下载PDF
基于深度学习的手势识别研究
20
作者 崔兆文 刘肖飞 +2 位作者 夏诗楠 王旭亚 瞿竟 《传感器技术与应用》 2024年第4期570-578,共9页
本文提出了一种基于深度学习的手势识别系统,该系统利用YOLO捕获手部信息,利用ReXNet捕捉手部21个关键点,利用ResNet-50实现对手势进行分类。试验结果表明,YOLOv5可以准确地将手部信息提取出来,准确度达98.5%;ReXNet捕捉手部21个关键点... 本文提出了一种基于深度学习的手势识别系统,该系统利用YOLO捕获手部信息,利用ReXNet捕捉手部21个关键点,利用ResNet-50实现对手势进行分类。试验结果表明,YOLOv5可以准确地将手部信息提取出来,准确度达98.5%;ReXNet捕捉手部21个关键点的准确度达97.2%;ResNet-50手势识别的准确度达98.2%。表明该方法能够检测图像中手势相关信息,对于手势控制有一定的借鉴意义。 展开更多
关键词 手势识别 YOLOv5 ReXNet resnet-50
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部