期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
数据集不均衡下的设备故障程度识别方法研究 被引量:14
1
作者 段礼祥 郭晗 王金江 《振动与冲击》 EI CSCD 北大核心 2016年第20期178-182,共5页
在机械故障诊断中,由于故障样本难以收集且数量远远少于正常样本,即产生数据集不均衡问题。这将导致传统的分类算法如支持向量机(SVM)在处理不均衡分类问题时对少数类样本(故障样本)的分类准确率过低。加权支持向量机(C-SVM)算法是一种... 在机械故障诊断中,由于故障样本难以收集且数量远远少于正常样本,即产生数据集不均衡问题。这将导致传统的分类算法如支持向量机(SVM)在处理不均衡分类问题时对少数类样本(故障样本)的分类准确率过低。加权支持向量机(C-SVM)算法是一种处理样本集不均衡问题的常用算法,可以在一定程度上改善少数类样本的分类准确率。但是在故障程度相近时会导致样本间距过小,加权C-SVM算法对这类故障样本的识别精度不理想。为提高数据集不均衡下故障程度相近样本的分类准确率,采用二叉树结构与加权C-SVM相结合的方法,综合考虑样本类间距离、类内距离和不均衡程度,优化二叉树结构。结果表明,该算法能够有效处理样本距离过近的不均衡数据集分类问题,从而提高了故障程度相近样本的分类准确率。 展开更多
关键词 故障诊断 故障程度识别 数据集不均衡 二叉树加权支持向量机
下载PDF
不均衡大数据集下的文本特征基因提取方法 被引量:7
2
作者 孙晶涛 张秋余 《电子科技大学学报》 EI CAS CSCD 北大核心 2018年第1期125-131,共7页
在不均衡大数据集情况下,传统特征处理方法偏重大类而忽略小类,影响分类性能。该文提出了一种文本特征基因提取方法。首先,基于样本类别分布不均衡对特征选择的影响,给出了一种结合信息熵的CHI统计矩阵特征选择方法,以强化小类的特征;然... 在不均衡大数据集情况下,传统特征处理方法偏重大类而忽略小类,影响分类性能。该文提出了一种文本特征基因提取方法。首先,基于样本类别分布不均衡对特征选择的影响,给出了一种结合信息熵的CHI统计矩阵特征选择方法,以强化小类的特征;然后,在探究多维统计数据高阶相关性的基础上,采取独立成分分析手段,设计了文本特征基因提取方法,用以增强特征项的泛化能力;最后,将这两种方法相融合,实现了在不均衡大数据集下的文本特征基因提取新方法。实验结果表明,所提方法具有较好的早熟性及特征降维能力,在小类的分类效果上优于常见特征选择算法。 展开更多
关键词 CHI统计选择方法 不均数据 独立成分分析 信息熵 文本特征基因提取
下载PDF
基于生成对抗网络与双注意力的糖网分类方法 被引量:1
3
作者 郭妮妮 乔钢柱 +1 位作者 张光华 王龙 《中北大学学报(自然科学版)》 CAS 2023年第1期39-47,共9页
针对在糖尿病视网膜病变分类过程中,因为数据集不均衡、类间特征相似、类内又存有差异,从而导致最终分类准确率不高的问题,提出了一种结合生成对抗网络与双注意力的分类方法AIDnet。首先,在ACGAN网络后加入转置卷积进行改进,生成轻度NPD... 针对在糖尿病视网膜病变分类过程中,因为数据集不均衡、类间特征相似、类内又存有差异,从而导致最终分类准确率不高的问题,提出了一种结合生成对抗网络与双注意力的分类方法AIDnet。首先,在ACGAN网络后加入转置卷积进行改进,生成轻度NPDR、重度NPDR、 PDR的图像平衡数据集;其次,在InceptionV3网络的基础上加入双注意力机制(DAM),在减少计算开销的同时提升性能;最后,利用焦点损失函数增加难以识别病变的权重,减少易识别病变的权重,高效提取DR图像的细节特征。实验结果表明,AIDnet网络在Kaggle数据集上的自动分类准确率为89.53%,敏感度为82.45%,特异性为93.26%;在Messidor2上的准确率达到90.31%,敏感度达到89.28%,特异性达到93.31%。较其他分类方法而言,AIDnet分类效果良好,有助于提高糖尿病视网膜病变的分类准确率。 展开更多
关键词 糖尿病视网膜病变分类 数据集不均衡 ACGAN 双注意力机制 InceptionV3 焦点损失
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部