期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
Unsupervised Feature Selection Using Structured Self-Representation
1
作者 Yanbei Liu Kaihua Liu +2 位作者 Xiao Wang Changqing Zhang Xianchao Tang 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2018年第3期62-73,共12页
Unsupervised feature selection has become an important and challenging problem faced with vast amounts of unlabeled and high-dimension data in machine learning. We propose a novel unsupervised feature selection method... Unsupervised feature selection has become an important and challenging problem faced with vast amounts of unlabeled and high-dimension data in machine learning. We propose a novel unsupervised feature selection method using Structured Self-Representation( SSR) by simultaneously taking into account the selfrepresentation property and local geometrical structure of features. Concretely,according to the inherent selfrepresentation property of features,the most representative features can be selected. Mean while,to obtain more accurate results,we explore local geometrical structure to constrain the representation coefficients to be close to each other if the features are close to each other. Furthermore,an efficient algorithm is presented for optimizing the objective function. Finally,experiments on the synthetic dataset and six benchmark real-world datasets,including biomedical data,letter recognition digit data and face image data,demonstrate the encouraging performance of the proposed algorithm compared with state-of-the-art algorithms. 展开更多
关键词 unsupervised feature selection local geometrical structure self-representation property high-dimension data
下载PDF
基于稀疏分位数回归的阿尔茨海默病认知能力研究
2
作者 温灿红 张雨 谭海珠 《计算机系统应用》 2024年第10期13-25,共13页
阿尔茨海默病是全球老龄化社会所面临的一项重大公共卫生挑战,其主要临床症状之一为认知能力的逐步下降.建立认知表现和神经影像学数据之间的模型,识别与认知能力改变相关的影像学生物标志物,已成为阿尔茨海默病研究的重要课题之一.然而... 阿尔茨海默病是全球老龄化社会所面临的一项重大公共卫生挑战,其主要临床症状之一为认知能力的逐步下降.建立认知表现和神经影像学数据之间的模型,识别与认知能力改变相关的影像学生物标志物,已成为阿尔茨海默病研究的重要课题之一.然而,脑部影像数据往往呈现高维、重尾分布并伴有异常值存在,这不仅降低了模型的准确性和稳定性,也对结果的解释提出挑战.本文采用稀疏分位数回归方法对阿尔茨海默病神经影像学计划数据库(ADNI)中的数据进行建模和特征选择,以克服上述问题.我们深入探究了认知得分在不同分位点下的分布特征,并成功地识别了与认知能力相关的特定脑区.实验结果表明,稀疏分位数回归方法在不同认知得分分位点下,均能准确识别出与认知能力相关的脑区.这一研究展示了将稀疏分位数回归方法应用于神经影像数据分析中的潜力,为神经影像学研究提供了全新的视角和方法. 展开更多
关键词 稀疏分位数回归 高维 阿尔茨海默病 认知能力 特征选择
下载PDF
大数据中基于熵加权的稀疏分数特征选择聚类算法 被引量:5
3
作者 魏霖静 宁璐璐 +1 位作者 郭斌 侯振兴 《计算机应用研究》 CSCD 北大核心 2018年第8期2293-2294,2303,共3页
为了提高大数据统计及分析的效率,有必要对数据集合进行聚类,以减少数据集合维度,并去掉相似数据冗余。采用熵加权和稀疏分数特征选择相结合,一方面对异构数据进行局部结构划分,降低数据维度,对局部结构的特征重要性标记并排序,提高聚... 为了提高大数据统计及分析的效率,有必要对数据集合进行聚类,以减少数据集合维度,并去掉相似数据冗余。采用熵加权和稀疏分数特征选择相结合,一方面对异构数据进行局部结构划分,降低数据维度,对局部结构的特征重要性标记并排序,提高聚类精度,另一方面,提高聚类稳定性。实验证明,该方法对不同种类的大数据聚类具有较强的适用性。 展开更多
关键词 数据聚类 熵加权 稀疏分数 特征选择 数据维度 大数据
下载PDF
高维数据分类中的特征降维研究 被引量:4
4
作者 刘立月 黄兆华 刘遵雄 《江西师范大学学报(自然科学版)》 CAS 北大核心 2012年第2期131-134,共4页
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性... 以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路. 展开更多
关键词 高维数据 降维 特征抽取 稀疏正则化
下载PDF
基于SS/OSF实现高维稀疏数据对象的聚类 被引量:5
5
作者 吴萍 宋瀚涛 +2 位作者 牛振东 张利萍 张聚礼 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期216-220,共5页
为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据... 为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据聚类结果中各个对象集合的上确界和下确界为新对象进行对象组分类.实验表明,与传统K-means聚类方法相比,随着数据对象数目的增加,该方法无论是在运行时间上,还是在聚类结果的准确度方面都有明显的改进. 展开更多
关键词 高维稀疏二态数据 对象组相似度 对象组特征向量 聚类 分类
下载PDF
基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤 被引量:13
6
作者 曹玉东 刘艳洋 +1 位作者 贾旭 王冬霞 《计算机应用研究》 CSCD 北大核心 2016年第6期1693-1696,共4页
提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。搜集并构造了60 000个垃圾图像样本,实验结果表明,利用改进的LSH算法能有效地... 提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。搜集并构造了60 000个垃圾图像样本,实验结果表明,利用改进的LSH算法能有效地提高垃圾图像的过滤速度。 展开更多
关键词 垃圾图像过滤 局部敏感哈希 图像特征提取 高维数据索引
下载PDF
多层极限学习机在入侵检测中的应用 被引量:18
7
作者 康松林 刘乐 +1 位作者 刘楚楚 廖锓 《计算机应用》 CSCD 北大核心 2015年第9期2513-2518,共6页
针对神经网络在入侵检测应用存在的维度高、数据大、获取标记样本难、特征构造难、训练难等问题,提出了一种基于深度多层极限学习机(ML-ELM)的入侵检测方法。首先,采用多层网络结构和深度学习方法抽取检测样本最高层次的抽象特征,用奇... 针对神经网络在入侵检测应用存在的维度高、数据大、获取标记样本难、特征构造难、训练难等问题,提出了一种基于深度多层极限学习机(ML-ELM)的入侵检测方法。首先,采用多层网络结构和深度学习方法抽取检测样本最高层次的抽象特征,用奇异值对入侵检测数据进行特征表达;然后,利用极限学习机(ELM)建立入侵检测数据的分类模型;其次,利用逐层的无监督学习方法解决入侵检测获取标记样本难的问题;最后采用KDD99数据集对该方法的性能进行了验证。实验结果表明:多层极限学习机的方法提高了检测正确率,检测漏报率也低至0.48%,检测速度比其他深度模型的检测方法提高了6倍以上。同时在极少标记样本的情况下仍有85%以上的正确率。通过多层网络结构的构建提高了对U2L、R2L这两类攻击的检测率。该方法集成深度学习和无监督学习的优点,能对高维度,大数据的网络记录用较少的参数得到更好的表达,在入侵检测的检测速度以及特征表达两个方面都具有优势。 展开更多
关键词 入侵检测 高维度 大数据 标记样本 特征构造 训练 多层极限学习机
下载PDF
基于稀疏聚类的高维数据特征选择及应用 被引量:3
8
作者 张陶陶 胡亚南 +1 位作者 李扬 田茂再 《统计与决策》 CSSCI 北大核心 2017年第4期18-24,共7页
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数... 文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用。将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标。 展开更多
关键词 稀疏聚类 高维数据 聚类 特征选择
下载PDF
基于主题扩展的领域问题分类方法 被引量:10
9
作者 张青 吕钊 《计算机工程》 CAS CSCD 北大核心 2016年第9期202-207,213,共7页
领域问题分类在问答系统中占有重要地位,但目前面向特定领域的研究较少。针对领域问题文本篇幅较短、数据稀疏的特点,提出基于主题扩展的领域问题分类方法。该方法主要包括特征选择和特征扩展2个部分。利用卡方统计量特征选择方法,将问... 领域问题分类在问答系统中占有重要地位,但目前面向特定领域的研究较少。针对领域问题文本篇幅较短、数据稀疏的特点,提出基于主题扩展的领域问题分类方法。该方法主要包括特征选择和特征扩展2个部分。利用卡方统计量特征选择方法,将问题文本选择的特征词作为特征扩展的依据。通过潜在狄利克雷分配主题模型对外部知识库进行分析,得到对应的主题分布。为避免引入噪声主题,采用主题熵的方法得到优质主题。将优质主题下所覆盖的词扩充到问题文本中,最后利用支持向量机分类器对问题文本进行分类。实验结果表明,与传统TFIDF文本分类方法相比,该方法分类效果较好,可提高问答系统的性能。 展开更多
关键词 领域问题分类 数据稀疏 特征选择 主题模型 优质主题 特征扩展
下载PDF
考虑数据排序的改进CABOSFV聚类 被引量:2
10
作者 武森 王静 谭一松 《计算机工程与应用》 CSCD 北大核心 2011年第34期127-129,共3页
CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序... CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序以改进CABOSFV算法的聚类质量。采用UCI基准数据集进行实验,结果表明与传统的CABOSFV算法相比,CABOSFV_CS有效地提高了聚类准确率。 展开更多
关键词 CABOSFV算法 高维数据 稀疏特征 聚类
下载PDF
高维数据特征提取算法的研究及比较 被引量:2
11
作者 林晓立 陈恩红 任皖英 《计算机科学》 CSCD 北大核心 2003年第4期168-170,共3页
This paper introduces and analyzes several feature extraction algorithms. These algorithms use linear or non-linear feature extraction methods to project high-dimensional objects into lower dimensional space, thus the... This paper introduces and analyzes several feature extraction algorithms. These algorithms use linear or non-linear feature extraction methods to project high-dimensional objects into lower dimensional space, thus the complexity of the operations upon them, such as clustering, the nearest-neighbor search, visualization and etc can be reduced. The paper also presents some comparative experimental results of these algorithms and analyzes briefly their advantages or shortcomings. 展开更多
关键词 Bourgain算法 Cofe算法 高维数据特征提取算法 数据集中 数据处理
下载PDF
一种基于稀疏自编码网络的数据降维方法研究 被引量:9
12
作者 朱啸天 张艳珠 王凡迪 《沈阳理工大学学报》 CAS 2016年第5期39-43,共5页
高维数据的"维数灾难"问题制约了机器学习、模式识别等诸多研究领域的发展研究。因此高维数据的降维方法,即将高维的特征数据化简投射到低维空间中,成为当前研究热点之一。稀疏自动编码器(Sparse Autoencoder)网络通过训练具... 高维数据的"维数灾难"问题制约了机器学习、模式识别等诸多研究领域的发展研究。因此高维数据的降维方法,即将高维的特征数据化简投射到低维空间中,成为当前研究热点之一。稀疏自动编码器(Sparse Autoencoder)网络通过训练具有多隐含层的神经网络将高维数据进行降维,能有效地解决了高维数据由于维数过大导致的识别率低的问题。将网络用于手写体数字图像识别及人脸图像识别实验,取得了较好地识别结果,表明稀疏自动编码网络能有效地对高维数据降维。 展开更多
关键词 高维数据降维 稀疏编码 图像识别
下载PDF
一种基于SAE和BP网络相结合的人脸识别模型 被引量:3
13
作者 李森林 石元泉 黄隆华 《怀化学院学报》 2017年第5期78-82,共5页
基于浅层BP网络的模式识别在诸多领域有着广泛的应用,但对于稀疏高维度的数据,在网络模型训练时计算量大、参数繁多、训练慢、准确率低.提出了一种基于稀疏自动编码器(Sparse auto-Encoder,SAE)和浅层BP网络相结合的人脸识别模型.在深度... 基于浅层BP网络的模式识别在诸多领域有着广泛的应用,但对于稀疏高维度的数据,在网络模型训练时计算量大、参数繁多、训练慢、准确率低.提出了一种基于稀疏自动编码器(Sparse auto-Encoder,SAE)和浅层BP网络相结合的人脸识别模型.在深度SAE模型中,通过设置隐藏节点数少于输入输出节点数方法,自动学习样本的多种特征表示,来实现数据的降维和去稀疏性,将该方法产生的特征表示作为输入新样本数据,用于BP网络模型进行图像识别.通过人脸识别实验表明,第一通过SAE模型得到的特征表示进行人脸识别是可行的;第二SAE模型获得的多种表示分别进行人脸识别,并非第j层表示比第i层表示(j>i)效果一定好;第三该方法比单纯浅层BP网络进行人脸识别在效果上有一定程度的改善和提高. 展开更多
关键词 稀疏自动编码器 神经网络 人脸识别 高维度数据 维度约减
下载PDF
基于深度学习的高维稀疏数据组合推荐算法 被引量:3
14
作者 李晓峰 李东 《计算机技术与发展》 2020年第2期104-108,共5页
传统方法在对高维稀疏数据进行检测的过程中,受到高维特征扰动的影响,数据误差较大,因此提出一种基于深度学习的高维稀疏数据组合推荐算法。采用相空间重构方法进行高维稀疏数据的特征重构,根据重构结果结合非线性统计序列分析方法进行... 传统方法在对高维稀疏数据进行检测的过程中,受到高维特征扰动的影响,数据误差较大,因此提出一种基于深度学习的高维稀疏数据组合推荐算法。采用相空间重构方法进行高维稀疏数据的特征重构,根据重构结果结合非线性统计序列分析方法进行高维稀疏数据的回归分析和点云结构重组,在此基础上提取高维稀疏数据的组合特征量;依据特征量提取结果采用特征提取技术抽取高维稀疏数据的平均互信息特征量,并结合关联规则挖掘方法进行高维稀疏数据的主成分分析,挖掘高维稀疏数据的相似度属性类别成分,最终采用深度学习方法进行高维稀疏数据组合推荐过程中的自适应寻优,实现高维稀疏数据的组合推荐。仿真结果表明,采用该算法进行高维稀疏数据推荐的属性归类辨识性较好,特征分辨能力较强,提高了数据的检测和识别能力。 展开更多
关键词 深度学习 高维稀疏数据 组合推荐 特征提取 挖掘
下载PDF
差分隐私的高维数据发布研究综述 被引量:4
15
作者 张兴 陈昊 《智能系统学报》 CSCD 北大核心 2021年第6期989-998,共10页
大数据时代的到来,使得信息量暴增的同时,数据维度也呈现几何式增长。在保护用户隐私的前提下,如何充分挖掘高维数据的可用信息,成为了大数据发布领域的研究热点和难点。差分隐私作为一种强大的隐私保护模型,被越来越多地应用到高维数... 大数据时代的到来,使得信息量暴增的同时,数据维度也呈现几何式增长。在保护用户隐私的前提下,如何充分挖掘高维数据的可用信息,成为了大数据发布领域的研究热点和难点。差分隐私作为一种强大的隐私保护模型,被越来越多地应用到高维数据发布中。本文归纳了差分隐私及其相关方法在高维数据发布的应用,重点分析了差分隐私和特征降维、特征抽取、贝叶斯网络、树模型以及最新提出的粗糙集和随机投影等方法在高维数据发布中结合应用的优缺点,梳理了各个方法在高维数据方面的应用和对比,最后对未来差分隐私在高维数据发布中的应用方向进行了展望。 展开更多
关键词 大数据发布 隐私保护 数据挖掘 高维数据 特征降维 贝叶斯网络 粗糙集 随机投影 差分隐私
下载PDF
高维大数据流时间维度特征提取方法仿真 被引量:3
16
作者 华涛 《计算机仿真》 北大核心 2021年第4期356-360,共5页
传统大数据流时间维度特征存在提取率低、数据异常值筛选实时性差的问题,提出高维大数据流时间维度特征提取方法。利用反向k近邻技术筛选实时数据的异常值,结合熵值法与多层增量特征提取方法,完成高维数据的初次提取,确定样本类型,将数... 传统大数据流时间维度特征存在提取率低、数据异常值筛选实时性差的问题,提出高维大数据流时间维度特征提取方法。利用反向k近邻技术筛选实时数据的异常值,结合熵值法与多层增量特征提取方法,完成高维数据的初次提取,确定样本类型,将数据纳入大数据信息流时间性算法,实现时间维度下数据分析及二次提取。仿真结果显示,上述方法在提高大数据特征提取率、增强数据提取能力方面具有明显优势,同时能够显著实时更新数据特征,实用性较强。 展开更多
关键词 高维数据 特征提取 时间维度 大数据时代 提取效率
下载PDF
基于启发式参考集选取的复杂数据特征提取算法
17
作者 林晓立 陈恩红 任皖英 《计算机工程》 CAS CSCD 北大核心 2003年第19期68-69,179,共3页
对当前具有代表性的几种特征提取算法进行了分析与比较,并在Bourgain算法的基础上,提出一种基于数据类别数及各类代表元素等启发式信息的复杂数据特征提取算法。对于M类复杂数据,该算法可以提取出维向量用来表示这些数据。针对实际数据... 对当前具有代表性的几种特征提取算法进行了分析与比较,并在Bourgain算法的基础上,提出一种基于数据类别数及各类代表元素等启发式信息的复杂数据特征提取算法。对于M类复杂数据,该算法可以提取出维向量用来表示这些数据。针对实际数据,对几种算法的降维性能进行了比较实验,实验结果表明该算法具有很好的特征提取效果。 展开更多
关键词 高维数据 特征提取 降维
下载PDF
具有稀疏特征的对象—属性子空间边缘重叠区域归属算法
18
作者 祝琴 陈华 《计算机应用研究》 CSCD 北大核心 2013年第1期99-102,113,共5页
通过分析具有稀疏特征的对象—属性子空间的特征,发现其边缘存在交叉重叠区域现象,为此,提出了基于聚类思想的具有稀疏特征的对象—属性子空间边缘的重叠区域归属算法(OASEDA),该算法能有效解决对象—属性子空间的独立性,算法根据子空... 通过分析具有稀疏特征的对象—属性子空间的特征,发现其边缘存在交叉重叠区域现象,为此,提出了基于聚类思想的具有稀疏特征的对象—属性子空间边缘的重叠区域归属算法(OASEDA),该算法能有效解决对象—属性子空间的独立性,算法根据子空间内部紧凑度和子空间之间分离度相对大小确定子空间边缘重叠区域的归属,并基于K-means算法结合权重理论设计了重叠区域归属判断目标函数,最后通过实验证明了该方法的有效性。 展开更多
关键词 具有稀疏特征的高维数据 对象—属性子空间 对象—属性子空间边缘重叠区域
下载PDF
基于对象组特征向量的聚类与分类的实现
19
作者 吴萍 张利萍 《计算机工程》 EI CAS CSCD 北大核心 2006年第16期17-19,57,共4页
高维稀疏数据的聚类分析是目前数据挖掘领域内亟待解决的问题之一。传统的聚类方法中,大部分不适用于高维稀疏数据,不能得到满意的结果。该文借助对象组相似度和对象组的特征向量,提出了一种实现聚类的方法。根据聚类结果后,根据聚类集... 高维稀疏数据的聚类分析是目前数据挖掘领域内亟待解决的问题之一。传统的聚类方法中,大部分不适用于高维稀疏数据,不能得到满意的结果。该文借助对象组相似度和对象组的特征向量,提出了一种实现聚类的方法。根据聚类结果后,根据聚类集合的上确界和下确界给出新对象的分类。该方法思想明了,实现起来简单轻松,结果准确可靠。 展开更多
关键词 高维稀疏二态数据 对象组相似度 对象组特征向量 聚类 分类
下载PDF
基于稀疏学习的鲁棒自表达属性选择算法
20
作者 何威 刘星毅 +1 位作者 程德波 胡荣耀 《计算机应用与软件》 CSCD 2016年第11期193-196,239,共5页
受属性选择处理高维数据表现的高效性和低秩自表达方法在子空间聚类上成功运用的启发,提出一种基于稀疏学习的自表达属性选择算法。算法首先将每个属性用其他属性线性表示得到自表达系数矩阵;然后结合稀疏学习的理论(即整合L2,1-范数为... 受属性选择处理高维数据表现的高效性和低秩自表达方法在子空间聚类上成功运用的启发,提出一种基于稀疏学习的自表达属性选择算法。算法首先将每个属性用其他属性线性表示得到自表达系数矩阵;然后结合稀疏学习的理论(即整合L2,1-范数为稀疏正则化项惩罚目标函数)实现属性选择。在以分类准确率和方差作为评价指标下,相比其他算法,实验结果表明该算法可更高效地选择出重要属性,且显示出非常好的鲁棒性。 展开更多
关键词 高维数据 属性选择 属性自表达 稀疏学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部