期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于数据变换的维数消减方法 被引量:4
1
作者 吴新玲 毋国庆 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2006年第1期73-76,共4页
为了提高高维数据集合数据挖掘效率,探讨了采用数据变换进行数据维数消减的方法及其应用,提出了一个通用的数据变换维数消减模型,给出了应用主成分分析方法计算模型中的数据变换矩阵的方法,相应的数据变换应用实例表明,通过数据变换用... 为了提高高维数据集合数据挖掘效率,探讨了采用数据变换进行数据维数消减的方法及其应用,提出了一个通用的数据变换维数消减模型,给出了应用主成分分析方法计算模型中的数据变换矩阵的方法,相应的数据变换应用实例表明,通过数据变换用相当少的变量来捕获原始数据的最大变化是可能的. 展开更多
关键词 据挖掘 维数消减 主成分分析 据变换
下载PDF
数据维数消减方法研究 被引量:2
2
作者 吴新玲 《计算机工程与设计》 CSCD 北大核心 2006年第16期3000-3002,共3页
对高维数据集合的维数消减方法及其应用进行了分类研究。将数据维数消减方法主要分为两类:子集选择法和数据变换法。基于统计数学和现有的数据挖掘模型,给出了这两类中的一些典型的维数消减方法,并对这些方法的主要特性和有效应用进行... 对高维数据集合的维数消减方法及其应用进行了分类研究。将数据维数消减方法主要分为两类:子集选择法和数据变换法。基于统计数学和现有的数据挖掘模型,给出了这两类中的一些典型的维数消减方法,并对这些方法的主要特性和有效应用进行了分析、探讨,给出了一些可行的方法实现策略。 展开更多
关键词 据挖掘 维数消减 子集选择 据变换 据分析
下载PDF
基于核函数-主成分维数约减的离群点检测 被引量:1
3
作者 徐雪松 刘耀宗 +2 位作者 赵学龙 张宏 刘凤玉 《计算机工程》 CAS CSCD 北大核心 2008年第8期82-84,共3页
为了提高高维数据集合离群数据挖掘效率,该文分析传统的离群数据挖掘算法,提出一种离群点检测算法。该算法将非线性问题转化为高维特征空间中的线性问题,利用核函数-主成分进行维数约减,逐个扫描数据对象的投影分量,判断数据点是否为离... 为了提高高维数据集合离群数据挖掘效率,该文分析传统的离群数据挖掘算法,提出一种离群点检测算法。该算法将非线性问题转化为高维特征空间中的线性问题,利用核函数-主成分进行维数约减,逐个扫描数据对象的投影分量,判断数据点是否为离群点,适用于线性可分数据集的离群点、线性不可分数据集的离群点的检测。实验表明了该算法的优越性。 展开更多
关键词 维数消减 核函 主成分
下载PDF
基于核函数距离测度的LLE降维及其在离群聚类中的应用 被引量:5
4
作者 徐雪松 张宏 刘凤玉 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第9期1996-2000,共5页
局部线性嵌入算法(locally linear embedding,LLE)是一种流形降维方法,在高维稀疏数据空间中,针对LLE不适合稀疏采样和欧氏距离公式的缺陷,研究该算法的扩展,引入核函数,并将样本映射到高维特征空间,核映射改善了样本的空间分布,改进的... 局部线性嵌入算法(locally linear embedding,LLE)是一种流形降维方法,在高维稀疏数据空间中,针对LLE不适合稀疏采样和欧氏距离公式的缺陷,研究该算法的扩展,引入核函数,并将样本映射到高维特征空间,核映射改善了样本的空间分布,改进的LLE方法在适当选取近邻点个数情况下,可得到良好的效果。对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得低维数据是否是离群数据进行判别。仿真文验的结果表明了该方法能够有效地发现高维数据集中的离群点,与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为离群点检测问题的机器学习提供了一条新的途径。 展开更多
关键词 核函 维数消减 非线性据集 离群 聚类
下载PDF
基于非线性数据变换的离群点检测算法 被引量:3
5
作者 徐雪松 张谞 +2 位作者 宋东明 张宏 刘凤玉 《中国工程科学》 2008年第9期74-78,共5页
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影... 为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性。 展开更多
关键词 维数消减 核函 主成分 离群
下载PDF
非线性数据变换及其在离群聚类中的应用
6
作者 徐雪松 《软件导刊》 2009年第10期6-9,共4页
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复... 为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得数据对象投影分量是否是离群数据进行判别。仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,为离群点检测问题的机器学习提供了一条新的途径。 展开更多
关键词 维数消减 主成分 离群 聚类
下载PDF
基于支持向量机的肿瘤基因识别 被引量:4
7
作者 王晶 周旷 《计算机与数字工程》 2011年第9期3-6,共4页
为了对基因表达数据矩阵中的肿瘤基因与正常基因进行判别分类,文章提出了基于支持向量机(Supporting Vector Machine,SVM)的肿瘤基因识别方法。在对基因进行特征选择的基础上,对只具有最优特征的基因样本再利用SVM分类思想进行判别,最... 为了对基因表达数据矩阵中的肿瘤基因与正常基因进行判别分类,文章提出了基于支持向量机(Supporting Vector Machine,SVM)的肿瘤基因识别方法。在对基因进行特征选择的基础上,对只具有最优特征的基因样本再利用SVM分类思想进行判别,最后通过与其他方法所得结果进行对比可知,该方案在不降低分类准确度的同时,能有效地避免特征空间维数远大于样本空间维数所造成的"过学习"问题,而且避免了大的时空开销,具有很强的实用性。 展开更多
关键词 基因表达 维数消减 支持向量机 K-均值聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部