基于保守自适应K-最近邻算法的维数约简

Dimensional Reduction Based on Conservative Adaptive K-Nearest Neighbor Algorithm

下载PDF

导出

摘要针对传统的k-最近邻算法存在不能根据样本密度进行自适应选择近邻点数目的缺陷,提出一种改进型的保守自适应k-最近邻算法。该算法首先对每个样本点选择m个近邻点,m取一个比较小的正整数,以保证不存在某个样本点无近邻点;其次把每个样本点的第m+1个最小的欧式距离作为最小值,最小值的α倍作为寻找近邻点的阈值;最后应用经典MDS算法计算。swiss-roll数据集上的降维实验结果表明,降维后的数据能很好地保持原有数据的邻域特性,能有效快捷地寻找近邻点。 An improved conservative and adaptive k-nearest neighbor algorithm is brought forward because the traditional k-nearest neighbor algorithm has a defect that can not select neighbor points adaptively based on the sample density.In this algorithm,m neighbor points,m a relatively small positive integer,are selected for each sample point to ensure that every sample point has its neighbor points,and the No.m＋1 smallest Euclidean distance is taken as the minimum value for each sample point and α times of the minimum value as the threshold for searching neighbor points,then the classical MDS algorithm is used to calculate.The dimensional reduction experimental results on swiss-roll dataset show that it is an efficient way to find neighbor points and keep the neighborhood characteristics of the original data well.

作者邢西峰陈月辉杨斌

机构地区济南大学信息科学与工程学院

出处《济南大学学报（自然科学版）》 CAS 北大核心 2010年第2期159-162,共4页 Journal of University of Jinan(Science and Technology)

基金国家自然科学基金(60573065) 山东省自然科学基金(Y2007G33)

关键词保守自适应k-最近邻维数约简 MDS算法 swiss-roll数据集流形学习 conservative adaptive k-nearest neighbor dimensional reduction MDS algorithm swiss-roll dataset manifold learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1王钰,周志华.机器学习及应用[M].北京:清华大学出版社,2006.
2TENENBAUM J B,SLVA DE V.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(12):2319-2323.
3ROWEIS S T,SAUL L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290:2323-2326.
4SAUL L K,ROWEIS S T.Unsupervised learning of low dimensional manifolds[J].Journal of Machine Learning Research,2003,4(6):119-155.
5ZHANG Zhenyue,ZHAO Hongyuan.Principal manifolds and nonlinear dimensionality reduction via tangent space alignment[J].SIAM Journal of Scientific Computing,2005,26(1):313-338.
6ZHAO Deli.Formulating LLE using alignment technique[J].Pattern Recognition,2006,39(11):2233-2235.
7杨剑,李伏欣,王珏.一种改进的局部切空间排列算法[J].软件学报,2005,16(9):1584-1590. 被引量：36
8吴晓婷,马玉梅.高维数据流形的低维嵌入问题研究[J].大连民族学院学报,2008,10(5):441-443. 被引量：1
9张春燕,汤进,赵海峰,罗斌.基于MDS的统计形状聚类[J].计算机技术与发展,2007,17(3):58-61. 被引量：4
10贾志刚,赵建立,张凤霞.广义对称矩阵的特征问题及其奇异值分解[J].山东大学学报（理学版）,2007,42(12):15-18. 被引量：2

二级参考文献34

1赵连伟,罗四维,赵艳敞,刘蕴辉.高维数据流形的低维嵌入及嵌入维数研究[J].软件学报,2005,16(8):1423-1430. 被引量：54
2[1]TENENBAUM J B,DE SILVA V,LANGFORD J C.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290 (12):2319-2323.
3[2]DONOHO D L,GRIMES C.When does ISOMAP recover the natural parameterization of families of articulated images[R].Technical Report,Department of Statistics,Stanford University,2002.
4[3]ROWELS S T,SAUL L K.Nonlinear dimensionality analysis by locally linear embedding[J].Science,2000,290(12):2323 -2326.
5[5]ZHANG Z Y,ZHA H Y.Principal manifolds and nonlinear dimensionality reduction via tangent space alignment[J].SIAM Journal of Scientific Computing,2005,26 (1):313-338.
6Seung HS, Lee DD. The manifold ways of perception. Science, 2000,290(5500):2268-2269.
7Donoho DL, Grimes C. Hessian Eigenmaps: New locally linear embedding techniques for high-dimensional data. Proc. of the National Academy of Sciences of the United States of American, 2003,100(10):5591-5596.
8.[EB/OL].http://www.cse.msu.edu/～lawhiu/manifold/,.
9Tenenbaum J, Silva VD, Langford J. A global geometric framework for nonlinear dimensionality reduction. Science, 2000,290(5500):2319-2323.
10Roweis S, Saul L. Nonlinear dimensionality reduction by locally linear embedding. Science, 2000290(5500):2323-2326.

共引文献40

1唐皓,刘希玉.引力流形上的空间聚类[J].科协论坛（下半月）,2009(10):96-98.
2罗四维,赵连伟.基于谱图理论的流形学习算法[J].计算机研究与发展,2006,43(7):1173-1179. 被引量：76
3刘峰,刘希玉,刘弘.流形上的空间密度聚类算法研究[J].中国海洋大学学报（自然科学版）,2007,37(4):681-684. 被引量：1
4杨剑,王珏,钟宁.流形上的Laplacian半监督回归[J].计算机研究与发展,2007,44(7):1121-1127. 被引量：15
5黄启宏,刘钊.流形学习中非线性维数约简方法概述[J].计算机应用研究,2007,24(11):19-25. 被引量：24
6赵继东,鲁珂,吴跃.一种基于谱图理论的Web图像搜索方法[J].计算机应用研究,2008,25(5):1598-1600. 被引量：2
7魏莱,王守觉,徐菲菲.一种自适应邻域选择算法[J].模式识别与人工智能,2008,21(3):406-409. 被引量：3
8曾宪华,罗四维.局部保持的流形学习算法对比研究[J].计算机工程与应用,2008,44(29):1-7. 被引量：4
9张炯,李凡长.基于流形学习的纤维丛模型研究[J].南京大学学报（自然科学版）,2008,44(5):477-485. 被引量：5
10王慧,刘希玉,李田来.基于流形的微粒群优化[J].计算机科学,2009,36(3):212-214. 被引量：1

1张艳军.基于ASP.NET在线考试系统防作弊策略[J].电脑知识与技术（过刊）,2010,0(33):9660-9662. 被引量：4
2王娜,侯爽.K-最近邻分类技术的新发展与技术改进[J].河北省科学院学报,2009,26(4):11-13. 被引量：5
3李占波,白全海,申义彩.基于主成分分析的网络入侵检测算法[J].计算机工程,2013,39(5):152-155. 被引量：6
4艾英山,张德贤.基于聚类和密度的KNN分类器训练样本约减方法[J].计算机与数字工程,2009,37(5):10-12.
5钟将,刘荣辉.一种改进的KNN文本分类[J].计算机工程与应用,2012,48(2):142-144. 被引量：27
6黎俊锋,朱锋峰.基于样本密度的FCM改进算法[J].科学技术与工程,2007,7(4):636-638. 被引量：12
7徐建民,李欢,刘博宁.在游戏中利用邻域特性扩展的kd-tree及其查找算法[J].计算机科学,2011,38(3):257-262. 被引量：1
8张妮,田学民,蔡连芳.基于动态结构保持主元分析的故障检测方法[J].中国石油大学学报（自然科学版）,2013,37(2):170-175.
9于学斗.基于核的K-最近邻算法的主动式防御研究[J].计算机安全,2009(7):55-57.
10叶飞虎,白光伟,沈航.无线传感器网络距离自调整的MDS定位算法[J].计算机科学,2012,39(5):40-43. 被引量：5

济南大学学报（自然科学版）

2010年第2期

浏览历史

内容加载中请稍等...

基于保守自适应K-最近邻算法的维数约简

参考文献10

二级参考文献34

共引文献40

相关作者

相关机构

相关主题

浏览历史