期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
样本过滤的基因表达数据分类
被引量:
2
1
作者
陆慧娟
陈伍涛
王明怡
《中国计量学院学报》
2009年第3期254-258,共5页
针对单个人工神经网络稳定性差、分类精度不高的缺点,提出了基于样本过滤的人工神经网络集成算法,并用于基因表达数据分类.采用基因表达数据集Leukemia进行实验仿真,并与单个BP神经网络、Bagging神经网络集成和支持向量机进行比较.结果...
针对单个人工神经网络稳定性差、分类精度不高的缺点,提出了基于样本过滤的人工神经网络集成算法,并用于基因表达数据分类.采用基因表达数据集Leukemia进行实验仿真,并与单个BP神经网络、Bagging神经网络集成和支持向量机进行比较.结果表明,样本过滤算法具有更好的稳定性和更高的分类精度.
展开更多
关键词
基因表达
样本过滤
人工神经网络集成
下载PDF
职称材料
基于样本过滤和迁移学习的多领域情感分类模型
2
作者
曲昭伟
赵燕娇
王晓茹
《中国科学技术大学学报》
CAS
CSCD
北大核心
2019年第1期8-14,共7页
目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参...
目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参数适用于多个领域下的不同数据集,使模型更具适用性和拓展性,即先将文档映射到领域的分布式表示,并以此作为领域分类和情感分类的桥梁,最后进行情感分类.为了使模型更具通用性,需要选择代表性强的数据样本,于是通过构建具有领域独立性的情感字典对属于同一文档的句子进行过滤,获取高质量的训练集.同时为了提高分类准确率并减少训练时间,使用基于参数的迁移学习方法,利用神经网络获得文档向量再进行分类.在包含15个不同领域的数据集上进行实验,与其他情感分类模型相比得到了较好的实验效果.
展开更多
关键词
情感分类
样本过滤
迁移学习
情感字典
神经网络
下载PDF
职称材料
谱聚类-Adaboost集成数据挖掘算法在岩性识别中的应用
被引量:
9
3
作者
朱林奇
张冲
《中国科技论文》
CAS
北大核心
2016年第5期545-550,共6页
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除...
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除数据冗余;依据数据挖掘集成思想中的Adaboost集成算法对基分类器C4.5进行集成优化,将弱分类器提升为强分类器,提升分类能力。通过对某地区498块致密砂岩岩样资料进行处理,结果表明:谱聚类方法的样本筛选能力较交会图方法与经典聚类方法更强;而Adaboost集成算法不仅精度较BP神经网络等经典分类算法高,而且具有着较强的泛化能力,较好地解决了基分类器存在的稳定性弱、泛化能力差等问题;利用谱聚类去除样本冗余-Adaboost集成算法判别的思想使得算法的稳定性更高,岩性判别率稳定到81.96%,明显高于其他判别方法;该方法思路新颖,效果较好,可以进行推广。
展开更多
关键词
地质学
数据挖掘
致密砂岩
谱聚类
稳定性
泛化能力
样本过滤
集成算法
下载PDF
职称材料
过采样算法在类别不平衡问题上的应用研究
被引量:
2
4
作者
刘亚明
杨策平
《湖北工业大学学报》
2018年第5期111-115,共5页
用4种过采样算法,并结合1种样本过滤算法,对12份类别不平衡程度不同的数据进行类别平衡处理,对平衡后的数据与不平衡的数据使用xgboost算法建立分类器,并对各数据集上的分类效果进行综合比较,为提升机器学习分类器在类别不平衡问题上的...
用4种过采样算法,并结合1种样本过滤算法,对12份类别不平衡程度不同的数据进行类别平衡处理,对平衡后的数据与不平衡的数据使用xgboost算法建立分类器,并对各数据集上的分类效果进行综合比较,为提升机器学习分类器在类别不平衡问题上的性能提供参考。
展开更多
关键词
类别不平衡
过采样
样本过滤
机器学习
下载PDF
职称材料
题名
样本过滤的基因表达数据分类
被引量:
2
1
作者
陆慧娟
陈伍涛
王明怡
机构
中国计量学院信息工程学院
中国矿业大学信息与电气工程学院
出处
《中国计量学院学报》
2009年第3期254-258,共5页
基金
国家自然科学基金资助项目(No.60842008
10602055)
文摘
针对单个人工神经网络稳定性差、分类精度不高的缺点,提出了基于样本过滤的人工神经网络集成算法,并用于基因表达数据分类.采用基因表达数据集Leukemia进行实验仿真,并与单个BP神经网络、Bagging神经网络集成和支持向量机进行比较.结果表明,样本过滤算法具有更好的稳定性和更高的分类精度.
关键词
基因表达
样本过滤
人工神经网络集成
Keywords
gene expression
sample filtering
artificial neural network ensemble
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于样本过滤和迁移学习的多领域情感分类模型
2
作者
曲昭伟
赵燕娇
王晓茹
机构
北京邮电大学计算机学院
出处
《中国科学技术大学学报》
CAS
CSCD
北大核心
2019年第1期8-14,共7页
基金
国家自然科学基金(61672108)资助
文摘
目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参数适用于多个领域下的不同数据集,使模型更具适用性和拓展性,即先将文档映射到领域的分布式表示,并以此作为领域分类和情感分类的桥梁,最后进行情感分类.为了使模型更具通用性,需要选择代表性强的数据样本,于是通过构建具有领域独立性的情感字典对属于同一文档的句子进行过滤,获取高质量的训练集.同时为了提高分类准确率并减少训练时间,使用基于参数的迁移学习方法,利用神经网络获得文档向量再进行分类.在包含15个不同领域的数据集上进行实验,与其他情感分类模型相比得到了较好的实验效果.
关键词
情感分类
样本过滤
迁移学习
情感字典
神经网络
Keywords
sentiment classification
sample filtering
transfer learning
sentiment lexicon
neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
谱聚类-Adaboost集成数据挖掘算法在岩性识别中的应用
被引量:
9
3
作者
朱林奇
张冲
机构
长江大学油气资源与勘探技术教育部重点实验室
长江大学地球物理与石油资源学院
出处
《中国科技论文》
CAS
北大核心
2016年第5期545-550,共6页
基金
国家自然科学基金资助项目(41404084)
湖北省自然科学基金资助项目(2013CFB396)
长江大学青年人才项目(2015cqr11)
文摘
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除数据冗余;依据数据挖掘集成思想中的Adaboost集成算法对基分类器C4.5进行集成优化,将弱分类器提升为强分类器,提升分类能力。通过对某地区498块致密砂岩岩样资料进行处理,结果表明:谱聚类方法的样本筛选能力较交会图方法与经典聚类方法更强;而Adaboost集成算法不仅精度较BP神经网络等经典分类算法高,而且具有着较强的泛化能力,较好地解决了基分类器存在的稳定性弱、泛化能力差等问题;利用谱聚类去除样本冗余-Adaboost集成算法判别的思想使得算法的稳定性更高,岩性判别率稳定到81.96%,明显高于其他判别方法;该方法思路新颖,效果较好,可以进行推广。
关键词
地质学
数据挖掘
致密砂岩
谱聚类
稳定性
泛化能力
样本过滤
集成算法
Keywords
geology
data mining
tight sandstone
spectral clustering
accuracy
generalization
sample filtering
integrated algorithm
分类号
P618.13 [天文地球—矿床学]
下载PDF
职称材料
题名
过采样算法在类别不平衡问题上的应用研究
被引量:
2
4
作者
刘亚明
杨策平
机构
湖北工业大学理学院
出处
《湖北工业大学学报》
2018年第5期111-115,共5页
文摘
用4种过采样算法,并结合1种样本过滤算法,对12份类别不平衡程度不同的数据进行类别平衡处理,对平衡后的数据与不平衡的数据使用xgboost算法建立分类器,并对各数据集上的分类效果进行综合比较,为提升机器学习分类器在类别不平衡问题上的性能提供参考。
关键词
类别不平衡
过采样
样本过滤
机器学习
Keywords
class imbalance
oversampling
sample filtering
machine learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
样本过滤的基因表达数据分类
陆慧娟
陈伍涛
王明怡
《中国计量学院学报》
2009
2
下载PDF
职称材料
2
基于样本过滤和迁移学习的多领域情感分类模型
曲昭伟
赵燕娇
王晓茹
《中国科学技术大学学报》
CAS
CSCD
北大核心
2019
0
下载PDF
职称材料
3
谱聚类-Adaboost集成数据挖掘算法在岩性识别中的应用
朱林奇
张冲
《中国科技论文》
CAS
北大核心
2016
9
下载PDF
职称材料
4
过采样算法在类别不平衡问题上的应用研究
刘亚明
杨策平
《湖北工业大学学报》
2018
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部