期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
计算机辅助乳腺癌诊断中的非平衡学习技术 被引量:2
1
作者 沈晔 李敏丹 夏顺仁 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第1期1-7,共7页
针对计算机辅助诊断(CAD)中学习算法处理非平衡数据时,分类器预测具有大类样本的分类误差小,而稀有类样本的分类误差大的倾向性分类问题,提出基于反向k近邻的欠采样新方法.通过去除大类样本集中的噪声及冗余样本、保留具有类别代表性且... 针对计算机辅助诊断(CAD)中学习算法处理非平衡数据时,分类器预测具有大类样本的分类误差小,而稀有类样本的分类误差大的倾向性分类问题,提出基于反向k近邻的欠采样新方法.通过去除大类样本集中的噪声及冗余样本、保留具有类别代表性且可靠的样本作为有效样本以此平衡训练样本集,解决了欠采样引起的类别信息的丢失问题.基于UCI Breast-cancer数据集的仿真实验结果表明,该方法解决了非平衡学习问题的有效性,进一步的横向评测对比显示该算法性能显著优于其他同类算法. 展开更多
关键词 计算机辅助诊断 非平衡学习 支持向量机 反向k近邻 欠采样
下载PDF
基于半监督过采样非平衡学习的矿山微震信号识别 被引量:3
2
作者 程健 杨凌凯 +2 位作者 王全魁 崔宁 郭一楠 《煤炭科学技术》 CAS 北大核心 2018年第2期213-218,202,共7页
为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类... 为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类器进行模式识别。通过在兖矿集团微震数据集进行试验,结果表明:针对微震数据的半监督过采样框架可以有效提高微震数据的识别准确率。与只进行过采样的方法相比,使用CPLE和SELF两种半监督学习的方法,在KNN、LR、FLD、RF、SVM和Adaboost这6个分类器上有5个分类器上识别效果更好,可以获得更好的回归率和F1的指标。此方法可以获得高维微震数据的压缩表达,解决不平衡微震数据集的识别问题。 展开更多
关键词 非平衡学习 半监督学习 模式识别 矿山微震
下载PDF
基于非平衡学习与交互式标注的引文情感动机标注系统
3
作者 孙亦昕 许露 +5 位作者 郑翼斐 朱妍 唐媛 董猛 刘宇 胡凯 《软件工程》 2020年第7期56-59,52,共5页
随着现代文献的数据量不断增长,仅仅依靠论文引用次数的传统方式无法很好的描述论文的真实影响力,基于引文内容的情感动机的研究成为新的研究重点。虽然当前的研究中存在大量自然语言处理工具可以处理文献文本,但并没有专门针对文献引... 随着现代文献的数据量不断增长,仅仅依靠论文引用次数的传统方式无法很好的描述论文的真实影响力,基于引文内容的情感动机的研究成为新的研究重点。虽然当前的研究中存在大量自然语言处理工具可以处理文献文本,但并没有专门针对文献引文情感动机的处理工具。为解决引文动机样本分布极度不均衡和引文动机标注数据生成效率低下的问题,本文提出构建一个基于非平衡学习和交互式标注的引文系统。经过实验证明,本文提出的系统可以较好提高引文情感动机标注效率。 展开更多
关键词 非平衡学习 引文情感动机 交互式 标注系统
下载PDF
非平衡集成迁移学习模型及其在桥梁结构健康监测中的应用 被引量:4
4
作者 于重重 吴子珺 +2 位作者 谭励 涂序彦 田蕊 《智能系统学报》 CSCD 北大核心 2013年第1期46-51,共6页
在桥梁结构健康监测与状态评估过程中所获得的桥梁结构数据库常存在间断性异常或缺损,且不同样本分类数据不均匀,难以在信息缺失、数据分布失衡的情况下完成对桥梁结构健康的监测与状态评估.针对这一问题,在改进相似性度量函数的SOM聚... 在桥梁结构健康监测与状态评估过程中所获得的桥梁结构数据库常存在间断性异常或缺损,且不同样本分类数据不均匀,难以在信息缺失、数据分布失衡的情况下完成对桥梁结构健康的监测与状态评估.针对这一问题,在改进相似性度量函数的SOM聚类算法和非平衡集成迁移学习算法的基础上,提出了一种改进的迁移学习模型.通过对实际监测数据的分析,该迁移学习模型的分类精度随着目标数据集所占比例的不断增加而提高,验证了该模型的有效性和科学性. 展开更多
关键词 平衡集成迁移学习算法 SOM算法 迁移学习模型 桥梁结构健康监测
下载PDF
基于惩罚的SVM和集成学习的非平衡数据分类算法研究 被引量:6
5
作者 刘进军 《计算机应用与软件》 CSCD 北大核心 2014年第1期186-190,共5页
利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易... 利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易发生错分的问题;并提出由重构采样层、基本训练层和综合判定层组成的集成学习模型。利用UCI公共数据集的实验验证了PFKSVM算法及集成模型在处理非平衡数据分类时的优势。 展开更多
关键词 数据挖掘 支持向量机(SVM) 平衡数据分类集成学习
下载PDF
一种新的过采样算法DB_SMOTE 被引量:12
6
作者 刘余霞 刘三民 +1 位作者 刘涛 王忠群 《计算机工程与应用》 CSCD 2014年第6期92-95,共4页
针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样... 针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB SMOTE算法是可行的。 展开更多
关键词 平衡数据学习 过采样 数据分类
下载PDF
基于距离最大熵值的蛋白质结构域边界检测系统 被引量:1
7
作者 邹淑雪 刘桂霞 +1 位作者 时小虎 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2009年第6期1237-1240,共4页
首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题,提出一种新的欠采样方法,即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样.以经过筛选的蛋白质结构域数据库作为实验数据,支持向量机学习系统的平均... 首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题,提出一种新的欠采样方法,即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样.以经过筛选的蛋白质结构域数据库作为实验数据,支持向量机学习系统的平均预测准确率可达80%,同时具有较高的敏感性和特异性. 展开更多
关键词 蛋白质结构域边界 支持向量机 平衡数据学习 基于距离的最大熵
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部