期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于改进VGG的变电站设备声频故障分析
1
作者 李志锦 谭劲章 《流体测量与控制》 2024年第4期28-31,共4页
由于长时间运行、设备老化、外部环境等原因,变电站设备存在着故障的风险。因此,对变电站设备的故障进行有效的监测和预警,成为电力系统安全运行的关键。而视觉几何组(VGG)算法是一种基于卷积神经网络的深度分析模型,该算法具有多层卷... 由于长时间运行、设备老化、外部环境等原因,变电站设备存在着故障的风险。因此,对变电站设备的故障进行有效的监测和预警,成为电力系统安全运行的关键。而视觉几何组(VGG)算法是一种基于卷积神经网络的深度分析模型,该算法具有多层卷积和池化层,能够提取设备声频信号中故障特征来源,并进行分类,最终实现对变电站设备的运行状态进行实时分析。为此,通过改进VGG网络变电站设备的声频信号特征提取,实现了对设备故障的准确识别和预测。 展开更多
关键词 视觉几何组(vgg)网络 声频故障 故障预警 变电站设备
下载PDF
时频能量谱与VGG16结合的车轮扁疤损伤程度估计方法 被引量:1
2
作者 李大柱 牛江 +1 位作者 梁树林 池茂儒 《中国机械工程》 EI CAS CSCD 北大核心 2023年第16期1907-1914,共8页
为了实现对运营中车辆车轮扁疤损伤程度的实时精准监测,提出了一种时频能量谱与VGG16卷积神经网络相结合的车轮扁疤损伤程度估计方法,该方法通过对车辆运营中轴箱振动加速度信号的分析处理来实时定量估计车轮扁疤的损伤程度。建立了车... 为了实现对运营中车辆车轮扁疤损伤程度的实时精准监测,提出了一种时频能量谱与VGG16卷积神经网络相结合的车轮扁疤损伤程度估计方法,该方法通过对车辆运营中轴箱振动加速度信号的分析处理来实时定量估计车轮扁疤的损伤程度。建立了车辆轨道刚柔耦合系统动力学模型和车轮扁疤数学模型,仿真计算不同扁疤损伤工况下的车辆轴箱振动响应。运用形态学滤波器以及完全噪声辅助集合经验模态分解结合Wigner-Ville分布的时频分析方法,将轴箱振动加速度信号滤波降噪后表达在时频能量谱中。构造了VGG16卷积神经网络模型,通过大量车轮扁疤故障数据的时频能量谱构造的训练集来训练VGG16模型。随机仿真若干车轮扁疤工况,对训练完善的VGG16模型进行测试验证。仿真试验表明,运用时频能量谱与VGG16模型结合的方法能准确地估计运营中车辆的车轮扁疤损伤程度,估计误差在1.6 mm内。 展开更多
关键词 车轮扁疤 形态学滤波 完全噪声辅助聚合经验模态分解 WIGNER-VILLE分布 vgg16 时频能量谱
下载PDF
Hierarchical Merging &Generalization Method of Three-Dimension City Model Group Based on the Theory of Spatial Visual Cognition
3
作者 Chaokui Li Jianhui Chen +2 位作者 Jun Fang Huiting Li Pu Bu 《Journal of Geographic Information System》 2019年第2期124-137,共14页
In order to simplify the three-dimensional building group model, this paper proposes a clustering generalization method based on visual cognitive theory. The method uses road elements to roughly divide scenes, and the... In order to simplify the three-dimensional building group model, this paper proposes a clustering generalization method based on visual cognitive theory. The method uses road elements to roughly divide scenes, and then uses spatial cognitive elements such as direction, area, height and their topological constraints to classify them precisely, so as to make them conform to the urban morphological characteristics. Delaunay triangulation network and boundary tracking synthesis algorithm are used to merge and summarize the models, and the models are stored hierarchically. The proposed algorithm should be verified experimentally with a typical urban complex model. The experimental results show that the efficiency of the method used in this paper is at least 20% higher than that of previous one, and with the growth of test data, the higher efficiency is improved. The classification results conform to human cognitive habits, and the generalization levels of different models can be relatively unified by adaptive control of each threshold in the clustering generalization process. 展开更多
关键词 visual COGNITION 3D Building Model group geometry THRESHOLD Hierarchical GENERALIZATION Cluster GENERALIZATION
下载PDF
Optimized Deep Learning Approach for Efficient Diabetic Retinopathy Classification Combining VGG16-CNN
4
作者 Heba M.El-Hoseny Heba F.Elsepae +1 位作者 Wael A.Mohamed Ayman S.Selmy 《Computers, Materials & Continua》 SCIE EI 2023年第11期1855-1872,共18页
Diabetic retinopathy is a critical eye condition that,if not treated,can lead to vision loss.Traditional methods of diagnosing and treating the disease are time-consuming and expensive.However,machine learning and dee... Diabetic retinopathy is a critical eye condition that,if not treated,can lead to vision loss.Traditional methods of diagnosing and treating the disease are time-consuming and expensive.However,machine learning and deep transfer learning(DTL)techniques have shown promise in medical applications,including detecting,classifying,and segmenting diabetic retinopathy.These advanced techniques offer higher accuracy and performance.ComputerAided Diagnosis(CAD)is crucial in speeding up classification and providing accurate disease diagnoses.Overall,these technological advancements hold great potential for improving the management of diabetic retinopathy.The study’s objective was to differentiate between different classes of diabetes and verify the model’s capability to distinguish between these classes.The robustness of the model was evaluated using other metrics such as accuracy(ACC),precision(PRE),recall(REC),and area under the curve(AUC).In this particular study,the researchers utilized data cleansing techniques,transfer learning(TL),and convolutional neural network(CNN)methods to effectively identify and categorize the various diseases associated with diabetic retinopathy(DR).They employed the VGG-16CNN model,incorporating intelligent parameters that enhanced its robustness.The outcomes surpassed the results obtained by the auto enhancement(AE)filter,which had an ACC of over 98%.The manuscript provides visual aids such as graphs,tables,and techniques and frameworks to enhance understanding.This study highlights the significance of optimized deep TL in improving the metrics of the classification of the four separate classes of DR.The manuscript emphasizes the importance of using the VGG16CNN classification technique in this context. 展开更多
关键词 No diabetic retinopathy(NDR) convolution layers(CNV layers) transfer learning data cleansing convolutional neural networks a visual geometry group(vgg16)
下载PDF
基于卷积神经网络的“舌边白涎”舌象识别研究
5
作者 李秋华 史国峰 +1 位作者 李玥博 任路 《湖南中医药大学学报》 CAS 2024年第7期1254-1260,共7页
目的通过机器学习分析“舌边白涎”舌象特性,对舌象进行局部特征识别研究,探讨卷积神经网络算法在舌象识别应用中的性能。方法使用Python进行图像预处理,搭建用于舌象识别的视觉几何组16层(visual geometry group 16,VGG16)卷积神经网... 目的通过机器学习分析“舌边白涎”舌象特性,对舌象进行局部特征识别研究,探讨卷积神经网络算法在舌象识别应用中的性能。方法使用Python进行图像预处理,搭建用于舌象识别的视觉几何组16层(visual geometry group 16,VGG16)卷积神经网络模型,分析其对“舌边白涎”舌象鉴别分析的效果,并结合热力图分析“舌边白涎”典型舌象表现。结果基于PyTorch框架,进行卷积神经网络的舌象鉴别研究,VGG16及残差网络50层(residual network 50,ResNet50)模型验证准确率均较高,达到80%以上,且ResNet50模型优于VGG16模型,可为舌象识别提供一定参考。基于加权梯度类激活映射(gradient-weighted class activation mapping,Grad-CAM)技术,通过舌苔舌色差异分布的网络可视化,有助于直观进行模型评估分析。结论基于卷积神经网络模型对舌象数据库进行分析,实现“舌边白涎”舌象识别,有助于临床诊疗的客观化辅助分析,为舌诊智能化发展提供一定借鉴。 展开更多
关键词 卷积神经网络 视觉几何组 PYTHON 人工智能 舌边白涎
下载PDF
基于深度学习及改进模糊KMeans的寻常型银屑病智能诊断方法 被引量:1
6
作者 石丽平 杜笑青 +2 位作者 李静 刘丽娟 张国强 《中国医学物理学杂志》 CSCD 2024年第2期253-257,共5页
为了解决寻常型银屑病在样本分布不平衡的数据中可能会导致的深度学习模型诊断效果下降等问题,通过结合改进模糊KMeans聚类算法对高聚类复杂度数据的处理能力以及Visual Geometry Group 13(VGG13)深度卷积神经网络模型的预测能力,提出... 为了解决寻常型银屑病在样本分布不平衡的数据中可能会导致的深度学习模型诊断效果下降等问题,通过结合改进模糊KMeans聚类算法对高聚类复杂度数据的处理能力以及Visual Geometry Group 13(VGG13)深度卷积神经网络模型的预测能力,提出一种基于改进模糊KMeans聚类算法的VGG13深度卷积神经网络(VGG13-KMeans)模型,并将其应用于寻常型银屑病的诊断任务中。实验结果表明,相较于VGG13以及ResNet18两种方法,本文方法更适用于对银屑病特征的识别。 展开更多
关键词 寻常型银屑病 改进模糊KMeans聚类算法 vgg13 深度卷积神经网络模型
下载PDF
Deep Learning-Based Classification of Rotten Fruits and Identification of Shelf Life
7
作者 S.Sofana Reka Ankita Bagelikar +2 位作者 Prakash Venugopal V.Ravi Harimurugan Devarajan 《Computers, Materials & Continua》 SCIE EI 2024年第1期781-794,共14页
The freshness of fruits is considered to be one of the essential characteristics for consumers in determining their quality,flavor and nutritional value.The primary need for identifying rotten fruits is to ensure that... The freshness of fruits is considered to be one of the essential characteristics for consumers in determining their quality,flavor and nutritional value.The primary need for identifying rotten fruits is to ensure that only fresh and high-quality fruits are sold to consumers.The impact of rotten fruits can foster harmful bacteria,molds and other microorganisms that can cause food poisoning and other illnesses to the consumers.The overall purpose of the study is to classify rotten fruits,which can affect the taste,texture,and appearance of other fresh fruits,thereby reducing their shelf life.The agriculture and food industries are increasingly adopting computer vision technology to detect rotten fruits and forecast their shelf life.Hence,this research work mainly focuses on the Convolutional Neural Network’s(CNN)deep learning model,which helps in the classification of rotten fruits.The proposed methodology involves real-time analysis of a dataset of various types of fruits,including apples,bananas,oranges,papayas and guavas.Similarly,machine learningmodels such as GaussianNaïve Bayes(GNB)and random forest are used to predict the fruit’s shelf life.The results obtained from the various pre-trained models for rotten fruit detection are analysed based on an accuracy score to determine the best model.In comparison to other pre-trained models,the visual geometry group16(VGG16)obtained a higher accuracy score of 95%.Likewise,the random forest model delivers a better accuracy score of 88% when compared with GNB in forecasting the fruit’s shelf life.By developing an accurate classification model,only fresh and safe fruits reach consumers,reducing the risks associated with contaminated produce.Thereby,the proposed approach will have a significant impact on the food industry for efficient fruit distribution and also benefit customers to purchase fresh fruits. 展开更多
关键词 Rotten fruit detection shelf life deep learning convolutional neural network machine learning gaussian naïve bayes random forest visual geometry group16
下载PDF
基于改进VGG网络的弱监督细粒度阿尔兹海默症分类方法 被引量:4
8
作者 邓爽 何小海 +2 位作者 卿粼波 陈洪刚 滕奇志 《计算机应用》 CSCD 北大核心 2022年第1期302-309,共8页
针对阿尔兹海默症(AD)患者和正常(NC)人之间核磁共振成像(MRI)图像差别小、分类难度大的问题,提出了基于改进VGG网络的弱监督细粒度AD分类方法。该方法以弱监督数据增强网络(WSDAN)为基本模型,主要由弱监督注意力学习模块、数据增强模... 针对阿尔兹海默症(AD)患者和正常(NC)人之间核磁共振成像(MRI)图像差别小、分类难度大的问题,提出了基于改进VGG网络的弱监督细粒度AD分类方法。该方法以弱监督数据增强网络(WSDAN)为基本模型,主要由弱监督注意力学习模块、数据增强模块及双线性注意力池化模块等构成。首先,通过弱监督力注意学习模块生成特征图和注意力图,并利用注意力图引导数据增强,将原图和增强后的数据同时作为输入数据进行训练;然后,通过双线性注意力池化算法将特征图和注意力图按元素进行点乘,进而得到特征矩阵;最后,将特征矩阵作为线性分类层的输入。将以VGG19作为特征提取网络的WSDAN基本模型应用到AD的MRI数据上,实验结果表明,仅使用图像增强的模型的准确性、敏感性和特异性分别比WSDAN基本模型提高了1.6个百分点、0.34个百分点和0.12个百分点;仅利用VGG19网络的改进的模型的准确性和特异性相较WSDAN基本模型分别提高了0.7个百分点和2.82个百分点;以上两个方法结合使用的模型与WSDAN基本模型相比,准确性、敏感性和特异性分别提高了2.1个百分点、1.91个百分点和2.19个百分点。 展开更多
关键词 改进vgg网络 弱监督 细粒度分类 数据增强 阿尔兹海默症
下载PDF
基于改进的VGG-16模型的花卉识别小程序设计
9
作者 王芳 郑圣勇 《信息与电脑》 2022年第11期157-159,共3页
由于花卉种类繁多,花卉的识别需要人们掌握深厚的植物学知识和长期观察的经验总结,而利用深度学习可实现花卉种类的智能识别。首先,通过迁移学习在视觉几何群网络(Visual Geometry Group Network,VGG-16)算法的基础上进行改进,实现花卉... 由于花卉种类繁多,花卉的识别需要人们掌握深厚的植物学知识和长期观察的经验总结,而利用深度学习可实现花卉种类的智能识别。首先,通过迁移学习在视觉几何群网络(Visual Geometry Group Network,VGG-16)算法的基础上进行改进,实现花卉的识别;其次,将训练好的模型进行封装,上传至云服务器;最后,在云服务器上进行识别,通过超文本传输协议(Hyper Text Transfer Protocol,HTTP)与微信小程序进行通信,实现了拍照上传即可识别花卉种类和了解花卉特性的小程序设计。 展开更多
关键词 迁移学习 视觉几何群网络(vgg-16)算法 微信小程序 植物识别与科普
下载PDF
基于VGG网络的鲁棒目标跟踪算法 被引量:5
10
作者 徐亮 张江 +1 位作者 张晶 杨亚琦 《计算机工程与科学》 CSCD 北大核心 2020年第8期1406-1413,共8页
针对传统目标跟踪算法中当目标被遮挡和受光照强度变化等多种因素干扰时,相关滤波器模板更新不准确,误差逐帧累积最终导致目标跟踪失败,提出了一种基于VGG网络的鲁棒目标跟踪算法。首先通过VGG网络对第1帧输入图像中的局部上下文区域提... 针对传统目标跟踪算法中当目标被遮挡和受光照强度变化等多种因素干扰时,相关滤波器模板更新不准确,误差逐帧累积最终导致目标跟踪失败,提出了一种基于VGG网络的鲁棒目标跟踪算法。首先通过VGG网络对第1帧输入图像中的局部上下文区域提取平均特征图来建立相关滤波器模板;然后通过VGG网络对后续帧输入图像中的局部上下文区域提取平均特征图和仿射变换平均特征图;其次与核相关滤波跟踪算法相结合,自适应确定目标位置和最终目标位置;最后自适应更新最终平均特征图和最终相关滤波器模板。实验结果表明,本文算法在目标被遮挡和受光照强度变化等多种因素干扰时,仍具有较高的目标跟踪精度和较强的鲁棒性。 展开更多
关键词 目标跟踪 vgg网络 核相关滤波 特征图更新 模板更新
下载PDF
基于SDP图像与VGG网络的旋转机械转子故障诊断研究 被引量:7
11
作者 武海彬 卜明龙 +1 位作者 刘圆圆 郝惠敏 《机电工程》 CAS 北大核心 2020年第9期1069-1074,共6页
针对传统故障诊断方法对旋转机械转子故障状态识别精度较低的问题,提出了一种基于对称点模式图像特征信息融合与深度学习相结合的旋转机械转子故障诊断方法。采用SDP信息融合技术,对转子故障状态下的多通道振动信号进行了信息融合,通过... 针对传统故障诊断方法对旋转机械转子故障状态识别精度较低的问题,提出了一种基于对称点模式图像特征信息融合与深度学习相结合的旋转机械转子故障诊断方法。采用SDP信息融合技术,对转子故障状态下的多通道振动信号进行了信息融合,通过SDP图形特征可简单直观地区分不同转子故障振动状态;结合深度学习VGG网络自适应提取了SDP图像的特征信息,对不同故障转化的SDP图像实现了准确的诊断识别,进而判别了其故障类型;通过变速器机械故障模拟实验验证了所提出方法的有效性,并与传统机器学习方法极限学习机(ELM)进行了比较。研究结果表明:基于SDP图像与VGG网络的旋转机械转子故障诊断方法解决了转子故障振动信号中存在的高复杂、非线性和不稳定问题,与传统机器学习方法ELM相比具有更高的识别精度。 展开更多
关键词 深度学习 vgg网络 SDP图像 多通道信息融合 转子故障诊断 极限学习机
下载PDF
Behavior recognition based on the fusion of 3D-BN-VGG and LSTM network 被引量:4
12
作者 Wu Jin Min Yu +2 位作者 Shi Qianwen Zhang Weihua Zhao Bo 《High Technology Letters》 EI CAS 2020年第4期372-382,共11页
In order to effectively solve the problems of low accuracy,large amount of computation and complex logic of deep learning algorithms in behavior recognition,a kind of behavior recognition based on the fusion of 3 dime... In order to effectively solve the problems of low accuracy,large amount of computation and complex logic of deep learning algorithms in behavior recognition,a kind of behavior recognition based on the fusion of 3 dimensional batch normalization visual geometry group(3D-BN-VGG)and long short-term memory(LSTM)network is designed.In this network,3D convolutional layer is used to extract the spatial domain features and time domain features of video sequence at the same time,multiple small convolution kernels are stacked to replace large convolution kernels,thus the depth of neural network is deepened and the number of network parameters is reduced.In addition,the latest batch normalization algorithm is added to the 3-dimensional convolutional network to improve the training speed.Then the output of the full connection layer is sent to LSTM network as the feature vectors to extract the sequence information.This method,which directly uses the output of the whole base level without passing through the full connection layer,reduces the parameters of the whole fusion network to 15324485,nearly twice as much as those of 3D-BN-VGG.Finally,it reveals that the proposed network achieves 96.5%and 74.9%accuracy in the UCF-101 and HMDB-51 respectively,and the algorithm has a calculation speed of 1066 fps and an acceleration ratio of 1,which has a significant predominance in velocity. 展开更多
关键词 behavior recognition deep learning 3 dimensional batch normalization visual geometry group(3D-BN-vgg) long short-term memory(LSTM)network
下载PDF
一种基于3D-BN-VGG网络的行为识别算法 被引量:3
13
作者 吴进 李聪 +2 位作者 梁爽 闵育 吴汉宁 《电讯技术》 北大核心 2019年第11期1237-1245,共9页
针对当前人体行为识别准确率低、计算量大等缺陷,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)结合批量归一化(Batch Normalization,BN)及改进的视觉几何组(Visual Geometry Group,VGG)网络的行为识别算... 针对当前人体行为识别准确率低、计算量大等缺陷,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)结合批量归一化(Batch Normalization,BN)及改进的视觉几何组(Visual Geometry Group,VGG)网络的行为识别算法。该算法首先对3D-CNN结构进行优化,在三维空间采用了多个小卷积核卷积层堆叠的Block结构;同时在网络结构中引入BN算法,将卷积层输出的特征图每一维进行独立的批量归一化处理;之后在Block结构中增加了Dropout层以提高网络泛化能力以及将3D-CNN网络层数加深到了13层,提高了高层次抽象特征的提取能力;最终使用softmax进行分类得出结果。实验结果表明所设计的3D-BN-VGG网络在行为识别方面有较高的识别率。 展开更多
关键词 行为识别 深度学习 三维卷积神经网络 批量归一化 视觉几何组
下载PDF
基于VGGNet-plus的路面裂痕自动分类识别方法 被引量:1
14
作者 肖彭昊 杨修伟 范媛媛 《电子器件》 CAS 北大核心 2022年第2期490-493,共4页
为了有效自动化地识别路面裂缝,在深度学习神经网络VGGNet基础上,提出了基于VGGNet-plus网络的路面裂痕自动分类识别方法。该网络增加了Dropout层和残差层,并在每个卷积层后连接Batch_normalize(BN)层和LeakyReLu层,解决了训练参数过多... 为了有效自动化地识别路面裂缝,在深度学习神经网络VGGNet基础上,提出了基于VGGNet-plus网络的路面裂痕自动分类识别方法。该网络增加了Dropout层和残差层,并在每个卷积层后连接Batch_normalize(BN)层和LeakyReLu层,解决了训练参数过多、深度神经网络的过拟合等问题,简化计算同时减少训练时间。为了增加训练样本的数量,同时使该方法对采集光照条件、角度、噪声等造成的影响具有更强的适应性和鲁棒性,通过灰度处理,上下翻转,左右翻转,灰度二值处理,均值滤波,灰度gamma处理,高斯滤波,中值滤波等方法来进行数据增容。通过Bagging模型集成方法,对预测的数据进行综合评估后选取最佳的预测结果。实验结果表明,VGGNet-plus网络在路面裂缝分类中的准确率可达92%,有效提升了路面裂缝自动检测精度。 展开更多
关键词 深度学习 裂缝分类 残差 数据增容 vggNet 模型集成
下载PDF
基于深度学习的小包外观图像分类识别 被引量:2
15
作者 顾昌铃 吴仔贤 《电子器件》 CAS 北大核心 2023年第5期1320-1324,共5页
为了提高对小包外观图像的分类识别准确率和测试精度。设计了一种基于深度学习的视觉几何组网算法结构来加强对图像分类识别的准确度。使用视觉几何组网对图像分类识别的准确度能够达到96%以上,而传统浅层和深层卷积神经网络对图像分类... 为了提高对小包外观图像的分类识别准确率和测试精度。设计了一种基于深度学习的视觉几何组网算法结构来加强对图像分类识别的准确度。使用视觉几何组网对图像分类识别的准确度能够达到96%以上,而传统浅层和深层卷积神经网络对图像分类识别的准确度只能够达到76%。使用视觉几何组网对小包外观图像进行分类识别准确率高,测试精度也有所提升。利用VGGNet-11与VGGNet-13分别对输入图片进行特征提取,并在最后对提取的特征进行耦合,以此来提高图像分类的准确性。 展开更多
关键词 小包外观图像 分类识别 深度学习 视觉几何组网
下载PDF
电动汽车充电系统串联电弧故障智能识别方法 被引量:2
16
作者 潘广旭 裴丽伟 +2 位作者 李兴玉 王希涛 班云升 《电力系统及其自动化学报》 CSCD 北大核心 2023年第10期107-114,共8页
为解决电动汽车充电系统串联电弧故障电弧电流难以准确检测的问题,提出一种基于机器学习的电动汽车充电系统串联电弧故障识别方法。首先,搭建电动汽车充电系统电弧故障实验平台,采集不同工况下故障电弧电流数据;然后,采用离散傅里叶变... 为解决电动汽车充电系统串联电弧故障电弧电流难以准确检测的问题,提出一种基于机器学习的电动汽车充电系统串联电弧故障识别方法。首先,搭建电动汽车充电系统电弧故障实验平台,采集不同工况下故障电弧电流数据;然后,采用离散傅里叶变换进行特征分析,并构建故障电弧特征数据集;最后,基于16层视觉几何群网络训练得到电弧故障检测模型,并利用各工况下测试集对电弧故障检测模型进行测试。研究结果表明该方法识别准确率均可达到98%以上,并拥有良好的抗干扰能力。 展开更多
关键词 电动汽车充电系统 直流电弧 电弧故障检测 16层视觉几何群网络
下载PDF
基于改进YOLOX-m的安全帽佩戴检测 被引量:1
17
作者 王晓龙 江波 《计算机工程》 CAS CSCD 北大核心 2023年第12期252-261,共10页
安全帽佩戴检测是安全监控系统中的重要组成部分,其检测精度取决于目标分类、小目标检测、域迁移差异等因素。针对现有基于YOLOX-m模型的安全帽佩戴检测算法通常存在分类精度较低、检测目标不完整、轻量化模型性能下降等问题,构建一种... 安全帽佩戴检测是安全监控系统中的重要组成部分,其检测精度取决于目标分类、小目标检测、域迁移差异等因素。针对现有基于YOLOX-m模型的安全帽佩戴检测算法通常存在分类精度较低、检测目标不完整、轻量化模型性能下降等问题,构建一种基于多阶段网络训练策略的改进YOLOX-m模型。首先对YOLOX-m主干特征网络卷积块的堆叠次数进行重新设计,在减小网络规模的同时最大化模型性能,然后将残差化重参视觉几何组与快速空间金字塔池化相结合,提高检测精度和推理速度。设计一种多阶段网络训练策略,将训练集和测试集拆分成多个组,并结合推理阶段生成的伪标签进行多次网络训练,以减少域迁移差异,获得更高的检测精度。实验结果表明,与YOLOX-m模型相比,改进YOLOX-m模型的推理延迟降低了5 ms,模型大小减少了4.7 MB,检测精度提高了1.26个百分点。 展开更多
关键词 安全帽佩戴检测 深度学习 残差化重参视觉几何组 快速空间金字塔池化 多阶段网络训练策略
下载PDF
采用深度卷积神经网络的路面破损智能识别 被引量:2
18
作者 陈嘉 季雪 +2 位作者 戴伊 蒋子平 阙云 《福州大学学报(自然科学版)》 CAS 北大核心 2022年第4期530-536,共7页
为有效识别沥青路面病害类别,将VGG卷积神经网络引入沥青路面病害识别中.根据VGG模型随着卷积核深度的加深可获得图片更深层次特征的特点,将VGG模型最后一层卷积核的卷积深度加深,得到改进型VGG模型,并与原始VGG模型进行比较.结果表明:... 为有效识别沥青路面病害类别,将VGG卷积神经网络引入沥青路面病害识别中.根据VGG模型随着卷积核深度的加深可获得图片更深层次特征的特点,将VGG模型最后一层卷积核的卷积深度加深,得到改进型VGG模型,并与原始VGG模型进行比较.结果表明:改进型VGG模型每步用时278 ms,相比于原始模型每步用时258 ms略有增加,而病害识别精度进一步提升了1.36%,对龟裂、松散等复杂裂缝分别提高了1.12%、0.84%.可见,VGG模型可有效识别路面病害,将其适当改进后效果更佳,对诸如松散、龟裂等复杂路面病害可做到精确识别,能及时、有效监测路面破损状况. 展开更多
关键词 道路工程 路面病害 vgg卷积神经网络 病害识别 支持向量机
下载PDF
基于图像处理的城轨列车车号识别系统 被引量:3
19
作者 朱俊霖 段钰 +2 位作者 滕凯 邢宗义 宫伟 《铁路计算机应用》 2022年第9期20-24,共5页
针对现有射频识别标签易脱落损坏导致丢失车号的问题,提出了基于图像处理的城轨列车车号识别系统。利用工业相机拍摄城轨列车侧面车号,再采用加速稳健特征算法和变换不变低秩纹理方法对拍摄到的图片进行车号定位、校正、分割操作,利用Vi... 针对现有射频识别标签易脱落损坏导致丢失车号的问题,提出了基于图像处理的城轨列车车号识别系统。利用工业相机拍摄城轨列车侧面车号,再采用加速稳健特征算法和变换不变低秩纹理方法对拍摄到的图片进行车号定位、校正、分割操作,利用Visual Geometry Group-16(VGG-16)网络模型对分割好的车号字符进行识别。试验结果表明,该系统具有鲁棒性好、识别准确率高等特点,能够满足城轨列车车号获取的要求。 展开更多
关键词 城轨列车 车号定位 车号分割 车号识别 图像处理 vgg-16
下载PDF
基于Faster R-CNN的缝隙检测与提取算法 被引量:8
20
作者 肖创柏 柏鳗晏 禹晶 《北京工业大学学报》 EI CAS CSCD 北大核心 2021年第2期135-146,共12页
为了使快速区域卷积神经网络(faster region-based convolutional neural network,Faster R-CNN)适用于小尺寸结构缝隙目标检测的应用,提出了一种基于Faster R-CNN的缝隙检测与提取算法,保留了小尺寸结构目标的细节信息,并提升了检测准... 为了使快速区域卷积神经网络(faster region-based convolutional neural network,Faster R-CNN)适用于小尺寸结构缝隙目标检测的应用,提出了一种基于Faster R-CNN的缝隙检测与提取算法,保留了小尺寸结构目标的细节信息,并提升了检测准确率.该算法分为缝隙检测和缝隙提取2个阶段.首先,在faster R-CNN的目标检测框架下,选取ImageNet数据集上的视觉几何组(visual geometry group,VGG)网络预训练模型作为特征提取网络,调整网络模型使其适应具有小尺寸结构的缝隙目标,并通过缝隙检测网络的训练确定最优的网络超参数,获得缝隙目标边框.然后,根据对目标区域的分析,提出基于数学形态学算法的缝隙提取算法,将缝隙目标从背景中分割出来.最终通过去噪、断裂连接和细化操作提取单像素宽缝隙目标,通过统计单像素宽缝隙目标的像素点个数得到缝隙目标长度值.实验结果表明,该算法可准确且完整地提取缝隙目标,在铁轨裂缝数据集上平均准确率达到63.87%,在道路裂缝数据集上的F1-score指标达到65.6%. 展开更多
关键词 深度学习 卷积神经网络 缝隙检测 缝隙提取 快速区域卷积神经网络 视觉几何组
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部