期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
样本过滤的基因表达数据分类 被引量:2
1
作者 陆慧娟 陈伍涛 王明怡 《中国计量学院学报》 2009年第3期254-258,共5页
针对单个人工神经网络稳定性差、分类精度不高的缺点,提出了基于样本过滤的人工神经网络集成算法,并用于基因表达数据分类.采用基因表达数据集Leukemia进行实验仿真,并与单个BP神经网络、Bagging神经网络集成和支持向量机进行比较.结果... 针对单个人工神经网络稳定性差、分类精度不高的缺点,提出了基于样本过滤的人工神经网络集成算法,并用于基因表达数据分类.采用基因表达数据集Leukemia进行实验仿真,并与单个BP神经网络、Bagging神经网络集成和支持向量机进行比较.结果表明,样本过滤算法具有更好的稳定性和更高的分类精度. 展开更多
关键词 基因表达 样本过滤 人工神经网络集成
下载PDF
基于样本过滤和迁移学习的多领域情感分类模型
2
作者 曲昭伟 赵燕娇 王晓茹 《中国科学技术大学学报》 CAS CSCD 北大核心 2019年第1期8-14,共7页
目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参... 目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参数适用于多个领域下的不同数据集,使模型更具适用性和拓展性,即先将文档映射到领域的分布式表示,并以此作为领域分类和情感分类的桥梁,最后进行情感分类.为了使模型更具通用性,需要选择代表性强的数据样本,于是通过构建具有领域独立性的情感字典对属于同一文档的句子进行过滤,获取高质量的训练集.同时为了提高分类准确率并减少训练时间,使用基于参数的迁移学习方法,利用神经网络获得文档向量再进行分类.在包含15个不同领域的数据集上进行实验,与其他情感分类模型相比得到了较好的实验效果. 展开更多
关键词 情感分类 样本过滤 迁移学习 情感字典 神经网络
下载PDF
谱聚类-Adaboost集成数据挖掘算法在岩性识别中的应用 被引量:9
3
作者 朱林奇 张冲 《中国科技论文》 CAS 北大核心 2016年第5期545-550,共6页
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除... 针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除数据冗余;依据数据挖掘集成思想中的Adaboost集成算法对基分类器C4.5进行集成优化,将弱分类器提升为强分类器,提升分类能力。通过对某地区498块致密砂岩岩样资料进行处理,结果表明:谱聚类方法的样本筛选能力较交会图方法与经典聚类方法更强;而Adaboost集成算法不仅精度较BP神经网络等经典分类算法高,而且具有着较强的泛化能力,较好地解决了基分类器存在的稳定性弱、泛化能力差等问题;利用谱聚类去除样本冗余-Adaboost集成算法判别的思想使得算法的稳定性更高,岩性判别率稳定到81.96%,明显高于其他判别方法;该方法思路新颖,效果较好,可以进行推广。 展开更多
关键词 地质学 数据挖掘 致密砂岩 谱聚类 稳定性 泛化能力 样本过滤 集成算法
下载PDF
过采样算法在类别不平衡问题上的应用研究 被引量:2
4
作者 刘亚明 杨策平 《湖北工业大学学报》 2018年第5期111-115,共5页
用4种过采样算法,并结合1种样本过滤算法,对12份类别不平衡程度不同的数据进行类别平衡处理,对平衡后的数据与不平衡的数据使用xgboost算法建立分类器,并对各数据集上的分类效果进行综合比较,为提升机器学习分类器在类别不平衡问题上的... 用4种过采样算法,并结合1种样本过滤算法,对12份类别不平衡程度不同的数据进行类别平衡处理,对平衡后的数据与不平衡的数据使用xgboost算法建立分类器,并对各数据集上的分类效果进行综合比较,为提升机器学习分类器在类别不平衡问题上的性能提供参考。 展开更多
关键词 类别不平衡 过采样 样本过滤 机器学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部