期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于数据集特征的KNN最优K值预测方法 被引量:13
1
作者 李洪奇 杨中国 +1 位作者 朱丽萍 刘蔷 《计算机应用与软件》 CSCD 2016年第6期54-58,83,共6页
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征... KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征、简单算法精度特征、复杂度特征等构建特征向量,然后利用线性回归、神经网络等方法建立特征向量与最优K值之间的预测模型,并用该模型预测新数据集的最优K值。在UCI数据集上的实验表明,该方法能迅速预测最优K值,并确保一定的精度。 展开更多
关键词 KNN分类算法 数据集特征 信息熵 最优K
下载PDF
基于数据集相似性的分类算法推荐 被引量:6
2
作者 李洪奇 徐青松 +1 位作者 朱丽萍 戚雪晨 《计算机应用与软件》 CSCD 2016年第8期62-66,共5页
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相... 近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。 展开更多
关键词 数据挖掘 分类算法 数据集特征 性能评价 算法推荐
下载PDF
基于Fisher Score和社会选择优化的特征选择方法
3
作者 郑艺峰 李国和 +2 位作者 张文杰 潘雪玲 魏葆雅 《闽南师范大学学报(自然科学版)》 2021年第1期72-79,共8页
随着信息技术的发展,智能应用已经深入社会生活的各个方面.与此同时,数据量急剧增加,容易导致"维度灾难",从而降低分析模型的性能.为此,本文提出基于社会选择理论的特征选择方法,简称FBMN.首先,将社会选择理论与Fisher Score... 随着信息技术的发展,智能应用已经深入社会生活的各个方面.与此同时,数据量急剧增加,容易导致"维度灾难",从而降低分析模型的性能.为此,本文提出基于社会选择理论的特征选择方法,简称FBMN.首先,将社会选择理论与Fisher Score相结合用于计算特征相关性,从而获得稳定的近似全局最优特征排序.其次,提出平均不确定信息度量,并结合马尔科夫毯以有效的剔除冗余特征.最后,公开数据集的实验结果表明,FBMN有助于提高分类模型的性能,尤其在高维数据. 展开更多
关键词 数据挖掘 特征选择 社会选择理论 信息不确定性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部