期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于数据不均衡的CART决策树用电异常检测方法
1
作者 鞠默欣 周雨馨 +5 位作者 唐伟宁 于欢 宋昊燃 倪鹏翔 戚意彬 谢蓓欣 《吉林电力》 2024年第1期53-56,共4页
针对现有的用户用电行为数据量庞大,且正负样本不均衡从而导致用电异常检测准确率低的问题,通过合成少数类过采样技术算法增加样本数据,构建正负样本相对均衡的数据集。然后,通过分类回归树决策树模型对重平衡后的样本数据集进行特征提... 针对现有的用户用电行为数据量庞大,且正负样本不均衡从而导致用电异常检测准确率低的问题,通过合成少数类过采样技术算法增加样本数据,构建正负样本相对均衡的数据集。然后,通过分类回归树决策树模型对重平衡后的样本数据集进行特征提取,从而获得分类结果并对其进行可视化,通过五折交叉验证对该算法进行仿真实现,分析模型的可靠性及稳定性。结果表明,提出的方法提高了用户用电行为异常检测准确率,有效消除了数据不均衡对异常检测准确率的影响。 展开更多
关键词 数据不均衡 决策树 用电异常检测
下载PDF
数据集不均衡下的机电设备工作状态自动化控制系统
2
作者 梁中超 《自动化与仪表》 2024年第3期33-36,41,共5页
为改善系统控制效果,该文设计数据集不均衡下的机电设备工作状态自动化控制系统。构建机电设备工作状态自动化控制系统框架,利用CAN总线网络将其传输至控制层后,数据处理模块调用SMOTE算法对获取的机电设备工作状态数据作重构处理,控制... 为改善系统控制效果,该文设计数据集不均衡下的机电设备工作状态自动化控制系统。构建机电设备工作状态自动化控制系统框架,利用CAN总线网络将其传输至控制层后,数据处理模块调用SMOTE算法对获取的机电设备工作状态数据作重构处理,控制模块的CAN控制器根据电路开关状态实现机电设备状态的转换后,采用PID控制算法并引入人工智能技术实现机电设备工作状态自动化控制。实验结果表明,该系统可实现机电设备工作状态自动化控制,控制时间短,控制后的机电设备运行电流曲线与正常工况下基本一致,控制误差介于(0.01,0.02)区间。 展开更多
关键词 数据不均衡 机电设备 状态控制 CAN总线 PID控制 人工智能
下载PDF
数据集不均衡下的设备故障程度识别方法研究 被引量:13
3
作者 段礼祥 郭晗 王金江 《振动与冲击》 EI CSCD 北大核心 2016年第20期178-182,共5页
在机械故障诊断中,由于故障样本难以收集且数量远远少于正常样本,即产生数据集不均衡问题。这将导致传统的分类算法如支持向量机(SVM)在处理不均衡分类问题时对少数类样本(故障样本)的分类准确率过低。加权支持向量机(C-SVM)算法是一种... 在机械故障诊断中,由于故障样本难以收集且数量远远少于正常样本,即产生数据集不均衡问题。这将导致传统的分类算法如支持向量机(SVM)在处理不均衡分类问题时对少数类样本(故障样本)的分类准确率过低。加权支持向量机(C-SVM)算法是一种处理样本集不均衡问题的常用算法,可以在一定程度上改善少数类样本的分类准确率。但是在故障程度相近时会导致样本间距过小,加权C-SVM算法对这类故障样本的识别精度不理想。为提高数据集不均衡下故障程度相近样本的分类准确率,采用二叉树结构与加权C-SVM相结合的方法,综合考虑样本类间距离、类内距离和不均衡程度,优化二叉树结构。结果表明,该算法能够有效处理样本距离过近的不均衡数据集分类问题,从而提高了故障程度相近样本的分类准确率。 展开更多
关键词 故障诊断 故障程度识别 数据不均 二叉树加权支持向量机
下载PDF
不均衡数据对卷积神经网络的影响及改进算法
4
作者 马骏 钱亚冠 +2 位作者 郭艳凯 吴淑慧 云本胜 《浙江科技学院学报》 CAS 2020年第3期181-190,共10页
通过不同的数据分布、激活函数和网络结构对卷积神经网络(convolutional neural networks,CNN)的训练过程进行试验分析发现,数据不均衡会造成CNN训练过程收敛慢、泛化能力差的负面影响。针对这一问题,结合过抽样和欠抽样各自的优点,在... 通过不同的数据分布、激活函数和网络结构对卷积神经网络(convolutional neural networks,CNN)的训练过程进行试验分析发现,数据不均衡会造成CNN训练过程收敛慢、泛化能力差的负面影响。针对这一问题,结合过抽样和欠抽样各自的优点,在随机梯度下降算法的基础上,提出均衡小批量随机梯度下降算法(equilibrium mini-batch stochastic gradient descent,EMSGD),保证小批量内的数据均衡,精确调整更新参数的梯度方向。试验结果表明,均衡小批量随机梯度下降算法可以在数据不均衡条件下提高CNN训练误差收敛速度,提高泛化性能。 展开更多
关键词 数据不均衡 卷积神经网络 随机梯度下降
下载PDF
不均衡大数据集下的文本特征基因提取方法 被引量:7
5
作者 孙晶涛 张秋余 《电子科技大学学报》 EI CAS CSCD 北大核心 2018年第1期125-131,共7页
在不均衡大数据集情况下,传统特征处理方法偏重大类而忽略小类,影响分类性能。该文提出了一种文本特征基因提取方法。首先,基于样本类别分布不均衡对特征选择的影响,给出了一种结合信息熵的CHI统计矩阵特征选择方法,以强化小类的特征;然... 在不均衡大数据集情况下,传统特征处理方法偏重大类而忽略小类,影响分类性能。该文提出了一种文本特征基因提取方法。首先,基于样本类别分布不均衡对特征选择的影响,给出了一种结合信息熵的CHI统计矩阵特征选择方法,以强化小类的特征;然后,在探究多维统计数据高阶相关性的基础上,采取独立成分分析手段,设计了文本特征基因提取方法,用以增强特征项的泛化能力;最后,将这两种方法相融合,实现了在不均衡大数据集下的文本特征基因提取新方法。实验结果表明,所提方法具有较好的早熟性及特征降维能力,在小类的分类效果上优于常见特征选择算法。 展开更多
关键词 CHI统计选择方法 不均数据 独立成分分析 信息熵 文本特征基因提取
下载PDF
深度自编码与改进损失函数在极端不均衡故障诊断中的应用 被引量:5
6
作者 段敏霞 刘鑫 董增寿 《科学技术与工程》 北大核心 2021年第11期4432-4438,共7页
在实际应用中,滚动轴承大多时候都是在正常状态下工作,因此收集到的故障数据较少,这就会产生数据不均衡的问题。这种数据不均衡问题极大地影响着模型的拟合和泛化能力,导致模型产生过拟合情况,而往往忽视对小类别样本的学习。尤其当故... 在实际应用中,滚动轴承大多时候都是在正常状态下工作,因此收集到的故障数据较少,这就会产生数据不均衡的问题。这种数据不均衡问题极大地影响着模型的拟合和泛化能力,导致模型产生过拟合情况,而往往忽视对小类别样本的学习。尤其当故障样本数极少时,此问题更突出。针对这个问题,提出一种基于改进交叉熵损失函数的深度自编码器的诊断模型,首先提取振动数据的小波包能量,其次将小波包能量输入到深度自编码器中,最后通过SoftMax分类器得到诊断结果。改进的加权损失函数可以根据各类别样本的数量调整权重系数,样本数量越少,系数越大,使得模型在训练时更专注于数量较少的样本。通过在凯斯西储大学及西安交通大学的轴承数据集上的两个实验表明,加权损失函数可以提高极端不均衡数据的诊断精度。 展开更多
关键词 数据不均衡 加权损失函数 权重系数 诊断精度
下载PDF
一种面向管道堵塞不均衡样本集的主动学习方法 被引量:2
7
作者 王显龙 冯早 赵燕锋 《化工自动化及仪表》 CAS 2021年第3期222-231,共10页
针对城市排水管道堵塞检测识别过程中有标签的样本数量较少,人工标注管道数据样本成本高昂,以及管道堵塞数据集中存在明显的类别不均衡问题,提出基于主动学习的方法以解决上述问题。同时,将极限随机树作为基分类器,对未标注样本集进行... 针对城市排水管道堵塞检测识别过程中有标签的样本数量较少,人工标注管道数据样本成本高昂,以及管道堵塞数据集中存在明显的类别不均衡问题,提出基于主动学习的方法以解决上述问题。同时,将极限随机树作为基分类器,对未标注样本集进行分类识别;样本查询策略选择将分类熵和余弦相似度相结合的样本采样策略。该方法使得模型在主动学习的过程中能够提高对少数类样本的关注度。试验结果在两个不同不均衡程度的数据集上进行验证,结果表明:笔者提出的主动学习模型在两个试验数据集上对少数类的分类识别效果都取得了较高的F1度量值,模型的分类稳定性并没有受到数据不均衡程度变化的干扰。 展开更多
关键词 管道堵塞 数据不均衡 主动学习 分类熵 余弦相似度 极限随机树
下载PDF
不确定性感知与类别均衡的表情识别模型
8
作者 洪居兴 田媚 黄雅平 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第10期1532-1540,共9页
为解决真实场景下人脸表情识别不确定性和数据不均衡问题,提出不确定性感知与类别均衡的表情识别模型.首先设计标签分布生成网络,以更好地体现人脸表情分布特性,并提出基于标签分布的重要性加权损失函数,使用重要性值对输出结果进行加权... 为解决真实场景下人脸表情识别不确定性和数据不均衡问题,提出不确定性感知与类别均衡的表情识别模型.首先设计标签分布生成网络,以更好地体现人脸表情分布特性,并提出基于标签分布的重要性加权损失函数,使用重要性值对输出结果进行加权,促进模型对不确定性的抑制;然后使用距离约束损失函数,扩大不同重要性值分组之间的平均重要性值的差值,使用重标记模块,依据样本类别预测向量发现,纠正不确定性引起的噪声标签;最后为解决数据不均衡问题,提出基于标签分布的类别均衡损失函数,依据难易样本数量自适应地分配各个样本的权重,加强模型对难样本的学习.在RAF数据集中的实验结果表明,所提模型识别准确率达到88.36%,性能优于其他表情识别模型,证明了该模型的有效性. 展开更多
关键词 表情识别 不确定性 数据不均衡 标签分布 损失函数
下载PDF
边缘场景下动态联邦学习优化方法
9
作者 王志良 何刚 +3 位作者 俞文心 许康 文军 刘畅 《计算机技术与发展》 2024年第2期98-104,共7页
边缘计算(Edge Computing)是一种新的计算方式,通过在网络边缘提供计算服务,与传统的云计算模式相比,具有高可信度和低延迟等特点。联邦学习(FL)作为一种分布式机器学习方法,尽管具备保护隐私和数据安全的特性,却仍然面临设备异构和数... 边缘计算(Edge Computing)是一种新的计算方式,通过在网络边缘提供计算服务,与传统的云计算模式相比,具有高可信度和低延迟等特点。联邦学习(FL)作为一种分布式机器学习方法,尽管具备保护隐私和数据安全的特性,却仍然面临设备异构和数据不均衡等问题,导致出现部分参与者(边缘端)训练时间长、训练效率低下等问题。为了解决上述问题,该文提出了一种名为FlexFL的动态联邦学习优化算法。该算法引入了两层联邦学习策略,通过在同一参与者部署多个联邦学习训练服务和一个联邦学习聚合服务,将本地数据集平均分配给各个联邦学习训练服务,并每回合激活一定数量的训练服务。未激活的服务将休眠,不占用计算资源,并将资源平均分配给激活的服务,以加快训练速度。该算法能够平衡参与者设备异构和数据不均衡性带来的训练时间差异,从而提高整体训练效率。在MINST数据集和CIFAR数据集上与FedAvg联邦学习算法进行了对比实验,结果显示,FlexFL算法在减少时间消耗的同时,不降低模型性能。 展开更多
关键词 边缘计算 机器学习 联邦学习 服务动态缩放 数据不均衡 设备异构
下载PDF
新型电力系统中人工智能应用的关键技术 被引量:2
10
作者 蒲天骄 韩笑 《电力信息与通信技术》 2024年第1期1-13,共13页
在向新型电力系统升级转型的过程中,新一代人工智能技术是其中的关键创新技术之一,可以与传统机理方法形成优势互补。然而随着电力人工智能技术应用的推广与深入,逐渐凸显出影响应用成效的3个关键问题:数据均衡问题、模型可信性问题、... 在向新型电力系统升级转型的过程中,新一代人工智能技术是其中的关键创新技术之一,可以与传统机理方法形成优势互补。然而随着电力人工智能技术应用的推广与深入,逐渐凸显出影响应用成效的3个关键问题:数据均衡问题、模型可信性问题、实时优化协同问题。针对以上3个问题,文章梳理总结其对应的核心技术分支、发展现状与典型应用,提出通过数据增强、迁移学习、仿真推演等数据增强推演技术解决小样本带来的模型过拟合与泛化性能下降问题,通过串行、引导、嵌入、反馈、并行等数据机理融合模式解决模型安全性、可解释性、鲁棒性等可信危机问题,通过群体智能、混合增强智能等智能优化决策技术解决源荷高度不确定下的大规模资源快速、实时、精准决策。最后,结合3个关键问题维度,对电力人工智能发展所需要重点突破的技术方向进行了展望。 展开更多
关键词 新型电力系统 人工智能 数据不均衡 可信智能 决策智能
下载PDF
基于混合采样的设备健康状态预测方法研究
11
作者 刘家亦 安平凯 刘志勇 《软件》 2024年第2期47-51,共5页
针对因设备健康状态样本数据不均衡严重影响对健康状态预测效果的问题,提出基于混合采样实现数据均衡、改善预测效果的思路,设计了基于混合采样方法的样本数据平衡流程。通过采用Borderline-SMOTE算法补充少数类样本数量,利用改进K-mean... 针对因设备健康状态样本数据不均衡严重影响对健康状态预测效果的问题,提出基于混合采样实现数据均衡、改善预测效果的思路,设计了基于混合采样方法的样本数据平衡流程。通过采用Borderline-SMOTE算法补充少数类样本数量,利用改进K-means算法对多数类样本进行删除,将冗余数据剔除后,形成较为均衡的数据集提供给分类器。实验数据显示,无论是对数据进行欠采样还是过采样,均可提升评价指标AUC和G-mean;采用混合采样对数据进行平衡,评价指标改善更加明显。结果表明,本方法可以明显提升设备健康状态的预测效果,对装备管理部门实现精准维修具有重要的参考价值。 展开更多
关键词 数据不均衡 过采样 欠采样 混合采样 健康状态预测
下载PDF
基于深度学习的多标签不均衡心电信号分类
12
作者 顾浩丞 孙占全 《建模与仿真》 2024年第2期1693-1704,共12页
心电图(ECG)自动分类技术已经成为医学诊断的热门研究领域。在临床上,同一个患者通常伴随多种心律失常。为了能够精准分类出多种心律失常,本文提出了一种涵盖多种注意力机制的一维卷积神经网络模型。相比传统的机器学习或者深度学习方... 心电图(ECG)自动分类技术已经成为医学诊断的热门研究领域。在临床上,同一个患者通常伴随多种心律失常。为了能够精准分类出多种心律失常,本文提出了一种涵盖多种注意力机制的一维卷积神经网络模型。相比传统的机器学习或者深度学习方法提取特征的能力有限,引入的注意力机制能够引导模型学习心电信号中不同通道和空间位置之间的差异信息的同时结合全局稀疏自注意力,提高分类仿真模型对与心律失常有关特征的关注程度;其次,通过重采样技术以及在损失函数的设计上融入了标签相关性策略来应对多标签带来的类别不均衡问题。在两个公开的多标签心电数据集CPSC2018和PTB-XL上评估该网络的性能,macro-F1分别达到84.13%和73.6%。实验结果表明,该模型具有良好的分类性能。 展开更多
关键词 心电图 深度学习 多标签分类 卷积神经网络 注意力机制 数据不均衡
原文传递
基于联邦增量学习的工业物联网数据共享方法 被引量:10
13
作者 刘晶 董志红 +2 位作者 张喆语 孙志刚 季海鹏 《计算机应用》 CSCD 北大核心 2022年第4期1235-1243,共9页
针对工业物联网(IIOT)新增数据量大、工厂子端数据量不均衡的问题,提出了一种基于联邦增量学习的IIOT数据共享方法(FIL-IIOT)。首先,将行业联合模型下发到工厂子端作为本地初始模型;然后,提出联邦优选子端算法来动态调整参与子集;最后,... 针对工业物联网(IIOT)新增数据量大、工厂子端数据量不均衡的问题,提出了一种基于联邦增量学习的IIOT数据共享方法(FIL-IIOT)。首先,将行业联合模型下发到工厂子端作为本地初始模型;然后,提出联邦优选子端算法来动态调整参与子集;最后,通过联邦增量学习算法计算出工厂子端的增量加权,从而使新增状态数据与原行业联合模型快速融合。实验结果表明,在美国凯斯西储大学(CWRU)轴承故障数据集上,所提FIL-IIOT使轴承故障诊断精度达到93.15%,比联邦均值(FedAvg)算法和无增量公式的FIL-IIOT(FIL-IIOT-NI)方法分别提高了6.18个百分点和2.59个百分点,满足了基于工业增量数据的行业联合模型持续优化的需求。 展开更多
关键词 工业物联网(IIOT) 联邦学习 增量学习 数据不均衡 优选子端
下载PDF
生成对抗网络的多联机四通阀故障数据扩增策略及故障诊断
14
作者 曹子涵 周镇新 陈焕新 《制冷技术》 2021年第6期9-14,45,共7页
故障数据不足已经成为多联机故障诊断技术发展的主要障碍。本文采用生成对抗网络,对多联机四通阀故障数据进行了扩增,有效避免了数据驱动模型训练集数据不均衡问题,分析了引入生成对抗网络扩增的数据对数据驱动模型诊断准确率的影响。... 故障数据不足已经成为多联机故障诊断技术发展的主要障碍。本文采用生成对抗网络,对多联机四通阀故障数据进行了扩增,有效避免了数据驱动模型训练集数据不均衡问题,分析了引入生成对抗网络扩增的数据对数据驱动模型诊断准确率的影响。结果表明,引入生成对抗网络生成的多联机四通阀故障数据后,减缓了故障数据量和正常数据量的不平衡程度,测试集整体诊断准确率由92.29%提升至97.00%,几何诊断准确率由21.12%提升至97.13%。 展开更多
关键词 四通阀故障 生成对抗网络 故障诊断 数据不均衡
下载PDF
基于生成对抗网络的机械设备故障数据增强方法 被引量:1
15
作者 张健 王文权 +2 位作者 刘文彪 唐顺东 张俊玲 《工业控制计算机》 2021年第12期108-109,111,共3页
机械设备故障数据少、传统方法未考虑数据不均衡问题,导致预测分类算法准确率低,针对以上问题提出一种基于梯度惩罚Wasserstein距离生成对抗网络(WGAN-GP)的机械设备故障数据增强方法。首先将多维传感器数据转换为二维灰度图像;然后将... 机械设备故障数据少、传统方法未考虑数据不均衡问题,导致预测分类算法准确率低,针对以上问题提出一种基于梯度惩罚Wasserstein距离生成对抗网络(WGAN-GP)的机械设备故障数据增强方法。首先将多维传感器数据转换为二维灰度图像;然后将少数类样本的灰度图像作为WGAN-GP的输入进行对抗训练,待达到纳什平衡后,将生成的图像添加到故障样本中,降低数据样本的不均衡性;最后,通过计算图像结构相似性度量的方法,解决WGAN-GP自身生成数据难以量化评估的难题。实验表明,该方法能更加有效地提高在故障样本稀少情况下的预测分类精度。 展开更多
关键词 生成对抗网络 数据不均衡 数据增强 故障预测
下载PDF
不均衡数据集下基于CNN的中图分类标引方法 被引量:3
16
作者 翁梦娟 姚长青 +2 位作者 韩红旗 王莉军 冉亚鑫 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第7期87-95,共9页
【目的】提高类间分布不均匀数据下中图分类标引的精度。【方法】提出一种使用卷积神经网络(CNN)作为融合分类器的分类方法,相比于其他Stacking融合方法,本方法将各基模型的分类标签概率分布信息堆叠后作为CNN输入,无须人工设置基模型... 【目的】提高类间分布不均匀数据下中图分类标引的精度。【方法】提出一种使用卷积神经网络(CNN)作为融合分类器的分类方法,相比于其他Stacking融合方法,本方法将各基模型的分类标签概率分布信息堆叠后作为CNN输入,无须人工设置基模型权重。【结果】实验以中图分类法G4下三级类目为例,结果显示,本方法对不均衡中图类目的平均标引准确率达60%,相比于基线模型,本方法的分类精度有19%的绝对提升。【局限】在方法设计上依赖卷积神经网络中卷积核的设计,只能通过实验确定效果最佳的网络结构;融合阶段训练分类器的复杂度会随着类目数量和基模型数量的增加而增加。【结论】本方法可有效提高不均衡数据集下的标引精度,可与层级分类策略结合使用,实现中图全类目的自动化分类标引。 展开更多
关键词 分类标引 数据不均衡 CNN STACKING
原文传递
基于Logistic模型的小微贷不良用户画像
17
作者 孙璐 王小英 马锐欣 《统计学与应用》 2023年第6期1696-1706,共11页
随着互联网金融的发展及个人消费需求的日益增长,小微贷,特别是基于互联网的P2P借贷得到了较快的发展。但由于平台风险识别能力的缺失,部分平台产生大量违约情况,致使投资人遭受损失。为辅助平台及投资人有效识别不良用户,减少坏账带来... 随着互联网金融的发展及个人消费需求的日益增长,小微贷,特别是基于互联网的P2P借贷得到了较快的发展。但由于平台风险识别能力的缺失,部分平台产生大量违约情况,致使投资人遭受损失。为辅助平台及投资人有效识别不良用户,减少坏账带来的损失,本文基于国内外较有代表性的P2P平台:Prosper及拍拍贷上的数据,采用逻辑回归、决策树及支撑向量机三类模型对借款人进行信用评估,并依据模型结果得到小微贷不良用户画像。结果表明,逻辑回归模型时间复杂度低,具有优越的可解释性,更加适用于违约因素的研究。并且不良用户借款通常具有高利率、长期限的特点;同时用户本身没有稳定工作,收入较低。而常被我们关注到的性别、年龄以及学历反而影响较低。 展开更多
关键词 个人信用评估 用户画像 数据不均衡 网络小微贷
下载PDF
基于深度学习的玉米植株表型检测方法研究
18
作者 杨琳琳 别书凡 +4 位作者 王建坤 皇甫懿 刘焱 李文峰 施杰 《江苏农业科学》 北大核心 2023年第19期165-172,共8页
为了实现单株玉米植株表型的快速无损检测,提出了一种基于深度学习的玉米植株表型检测方法。采集玉米植株表型数据集(包含多视角玉米植株图像和人工测量的鲜质量、干质量、叶面积表型数据),采用大步距卷积、resize降尺寸和大步距池化层... 为了实现单株玉米植株表型的快速无损检测,提出了一种基于深度学习的玉米植株表型检测方法。采集玉米植株表型数据集(包含多视角玉米植株图像和人工测量的鲜质量、干质量、叶面积表型数据),采用大步距卷积、resize降尺寸和大步距池化层降采样3种方法进行图像降采样,减少了模型计算消耗的资源,降低了图像的尺寸,并对比普通卷积、深度卷积、深度可分离卷积3种卷积的效果。改进了均方误差(MSE)和平均绝对误差(MAE),对不同数据量的样本区间给予不同的权重,解决了小型数据集存在的数据不均衡问题。在对比试验中,首先构建鲜质量表型检测模型,然后将表现较好的模型在干质量与叶面积模型中试验,筛选出对应的最优模型。结果显示,基于深度卷积和B-MSE损失函数的模型在玉米植株鲜质量、干质量、叶面积上的效果都最优。其中,深度卷积的效果最好。改进后的B-MSE和B-MAE在玉米鲜质量3个模型测试集上的相关系数r均达到了0.98以上,确定系数R 2均达到了0.97以上,平均绝对百分比误差MAPE均在3.2%以内,在干质量与叶面积模型上也提高了测试集上的相关系数r和确定系数R 2,并且降低了MAPE。 展开更多
关键词 玉米 植株表型 深度学习 数据不均衡 无损检测
下载PDF
基于生成对抗网络与双注意力的糖网分类方法
19
作者 郭妮妮 乔钢柱 +1 位作者 张光华 王龙 《中北大学学报(自然科学版)》 CAS 2023年第1期39-47,共9页
针对在糖尿病视网膜病变分类过程中,因为数据集不均衡、类间特征相似、类内又存有差异,从而导致最终分类准确率不高的问题,提出了一种结合生成对抗网络与双注意力的分类方法AIDnet。首先,在ACGAN网络后加入转置卷积进行改进,生成轻度NPD... 针对在糖尿病视网膜病变分类过程中,因为数据集不均衡、类间特征相似、类内又存有差异,从而导致最终分类准确率不高的问题,提出了一种结合生成对抗网络与双注意力的分类方法AIDnet。首先,在ACGAN网络后加入转置卷积进行改进,生成轻度NPDR、重度NPDR、 PDR的图像平衡数据集;其次,在InceptionV3网络的基础上加入双注意力机制(DAM),在减少计算开销的同时提升性能;最后,利用焦点损失函数增加难以识别病变的权重,减少易识别病变的权重,高效提取DR图像的细节特征。实验结果表明,AIDnet网络在Kaggle数据集上的自动分类准确率为89.53%,敏感度为82.45%,特异性为93.26%;在Messidor2上的准确率达到90.31%,敏感度达到89.28%,特异性达到93.31%。较其他分类方法而言,AIDnet分类效果良好,有助于提高糖尿病视网膜病变的分类准确率。 展开更多
关键词 糖尿病视网膜病变分类 数据不均 ACGAN 双注意力机制 InceptionV3 焦点损失
下载PDF
基于EasyEnsemble的化工过程故障诊断性能改进 被引量:10
20
作者 夏丽莎 杨玉英 方华京 《控制理论与应用》 EI CAS CSCD 北大核心 2017年第1期49-53,共5页
化工过程故障诊断中样本数据分布不均衡现象普遍存在.在使用不均衡样本作为训练集建立各类故障诊断分类器时,易出现分类器的识别率偏置于多数类样本的结果,由此产生虽正常状态易识别,但更受关注的故障状态却难以被诊断的现象.针对该问题... 化工过程故障诊断中样本数据分布不均衡现象普遍存在.在使用不均衡样本作为训练集建立各类故障诊断分类器时,易出现分类器的识别率偏置于多数类样本的结果,由此产生虽正常状态易识别,但更受关注的故障状态却难以被诊断的现象.针对该问题,本文提出一种基于Easy Ensemble思想的主元分析–支持向量机(Easy Ensemble based principle component analysis–support vector machine,EEPS)故障诊断算法,通过欠采样方法抽取多数类样本子集组建多个新的均衡数据样本集,使用主元分析(principle component analysis,PCA)进行特征提取并使用支持向量机(support vector machine,SVM)算法进行训练,得到多个基于SVM的故障诊断分类器,然后使用Adaboost算法集成最终的分类,从而提高故障诊断准确性.所提方法被用于TE(Tenessee Eastman)化工过程,实验结果表明,EEPS算法能够有效提高分类器在不均衡数据集上的诊断性能和预报能力. 展开更多
关键词 化工过程 数据不均衡 EasyEnsemble 故障诊断
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部