期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据集特征的KNN最优K值预测方法
被引量:
13
1
作者
李洪奇
杨中国
+1 位作者
朱丽萍
刘蔷
《计算机应用与软件》
CSCD
2016年第6期54-58,83,共6页
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征...
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征、简单算法精度特征、复杂度特征等构建特征向量,然后利用线性回归、神经网络等方法建立特征向量与最优K值之间的预测模型,并用该模型预测新数据集的最优K值。在UCI数据集上的实验表明,该方法能迅速预测最优K值,并确保一定的精度。
展开更多
关键词
KNN分类算法
数据集特征
信息熵
最优K
下载PDF
职称材料
基于数据集相似性的分类算法推荐
被引量:
6
2
作者
李洪奇
徐青松
+1 位作者
朱丽萍
戚雪晨
《计算机应用与软件》
CSCD
2016年第8期62-66,共5页
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相...
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。
展开更多
关键词
数据挖掘
分类算法
数据集特征
性能评价
算法推荐
下载PDF
职称材料
基于Fisher Score和社会选择优化的特征选择方法
3
作者
郑艺峰
李国和
+2 位作者
张文杰
潘雪玲
魏葆雅
《闽南师范大学学报(自然科学版)》
2021年第1期72-79,共8页
随着信息技术的发展,智能应用已经深入社会生活的各个方面.与此同时,数据量急剧增加,容易导致"维度灾难",从而降低分析模型的性能.为此,本文提出基于社会选择理论的特征选择方法,简称FBMN.首先,将社会选择理论与Fisher Score...
随着信息技术的发展,智能应用已经深入社会生活的各个方面.与此同时,数据量急剧增加,容易导致"维度灾难",从而降低分析模型的性能.为此,本文提出基于社会选择理论的特征选择方法,简称FBMN.首先,将社会选择理论与Fisher Score相结合用于计算特征相关性,从而获得稳定的近似全局最优特征排序.其次,提出平均不确定信息度量,并结合马尔科夫毯以有效的剔除冗余特征.最后,公开数据集的实验结果表明,FBMN有助于提高分类模型的性能,尤其在高维数据.
展开更多
关键词
数据挖掘
特征选择
社会选择理论
信息不确定性
下载PDF
职称材料
题名
基于数据集特征的KNN最优K值预测方法
被引量:
13
1
作者
李洪奇
杨中国
朱丽萍
刘蔷
机构
中国石油大学
计算机系
中国石油大学石油数据挖掘北京市重点实验室
出处
《计算机应用与软件》
CSCD
2016年第6期54-58,83,共6页
基金
中国石油大学(北京)基金项目(KYJJ2012-05-25)
文摘
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征、简单算法精度特征、复杂度特征等构建特征向量,然后利用线性回归、神经网络等方法建立特征向量与最优K值之间的预测模型,并用该模型预测新数据集的最优K值。在UCI数据集上的实验表明,该方法能迅速预测最优K值,并确保一定的精度。
关键词
KNN分类算法
数据集特征
信息熵
最优K
Keywords
KNN classification algorithm
Dataset feature
Information entropy
Optimal K
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于数据集相似性的分类算法推荐
被引量:
6
2
作者
李洪奇
徐青松
朱丽萍
戚雪晨
机构
中国石油大学石油数据挖掘北京市重点实验室
中国石油大学
计算机系
出处
《计算机应用与软件》
CSCD
2016年第8期62-66,共5页
基金
十二五国家重大专项(2011ZX05020009)
北京市重点实验室阶梯计划项目(Z121109009212008)
文摘
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。
关键词
数据挖掘
分类算法
数据集特征
性能评价
算法推荐
Keywords
Data mining
Classification algorithm
Dataset features
Performance evaluation
Algorithm recommendation
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于Fisher Score和社会选择优化的特征选择方法
3
作者
郑艺峰
李国和
张文杰
潘雪玲
魏葆雅
机构
闽南师范
大学
计算机学院
闽南师范
大学
数据
科学与智能应用福建省高等学校
重点
实验室
中国石油大学石油数据挖掘北京市重点实验室
中国石油大学
信息科学与工程学院
出处
《闽南师范大学学报(自然科学版)》
2021年第1期72-79,共8页
基金
福建省自然科学基金(2018J01546,2019J01748)
福建省教育厅中青年项目(JAT190392)
+1 种基金
克拉玛依科技发展计划项目(2020CGZH0009)
中国石油大学(北京)克拉玛依校区科研基金(RCYJ2016B-03-001)。
文摘
随着信息技术的发展,智能应用已经深入社会生活的各个方面.与此同时,数据量急剧增加,容易导致"维度灾难",从而降低分析模型的性能.为此,本文提出基于社会选择理论的特征选择方法,简称FBMN.首先,将社会选择理论与Fisher Score相结合用于计算特征相关性,从而获得稳定的近似全局最优特征排序.其次,提出平均不确定信息度量,并结合马尔科夫毯以有效的剔除冗余特征.最后,公开数据集的实验结果表明,FBMN有助于提高分类模型的性能,尤其在高维数据.
关键词
数据挖掘
特征选择
社会选择理论
信息不确定性
Keywords
data mining
feature selection
social selection theory
information uncertainty
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于数据集特征的KNN最优K值预测方法
李洪奇
杨中国
朱丽萍
刘蔷
《计算机应用与软件》
CSCD
2016
13
下载PDF
职称材料
2
基于数据集相似性的分类算法推荐
李洪奇
徐青松
朱丽萍
戚雪晨
《计算机应用与软件》
CSCD
2016
6
下载PDF
职称材料
3
基于Fisher Score和社会选择优化的特征选择方法
郑艺峰
李国和
张文杰
潘雪玲
魏葆雅
《闽南师范大学学报(自然科学版)》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部