高维数据固有维数的自适应极大似然估计被引量：1

Intrinsic dimension estimation of high-dimensional data based on adaptive maximum likelihood

下载PDF

导出

摘要如何确定高维数据的固有维数是降维成功与否的关键。基于极大似然估计(MLE)的维数估计方法是一种新近出现的方法,实现简单,选择合适的近邻能取得不错的结果。但当近邻数过小或过大时,均有比较明显的偏差。其根本原因是没有考虑每个点对固有维数的不同贡献。在充分考虑数据集的分布信息之后,提出了一种改进的MLE——自适应极大似然估计(AMLE)。实验表明,无论在合成数据集还是真实数据集上,AMLE较MLE在估计准确度上均有很大的提高,对近邻数的变化也不甚敏感。 How to estimate the dimension of a dataset is very important to dimension reduction. Maximum likelihood estimation based method is a novel dimension estimation method, which is simple and performs well when appropriate neighbors are selected. But it is very sensitive to the neighbor number by reason of ignoring the distribution difference of each point. An improved maximum likelihood estimation method named AMLE was proposed in this paper, Considering the distribution of a dataset, AMLE adjusts the contribution of each point to the estimator by designing a weight function. By applying it to a number of simulated and real datasets, experimental results show that it performes better than MLE and other methods.

作者谷瑞军须文波刘军伟姚娟

机构地区南京审计学院信息科学学院江南大学信息工程学院无锡科技职业学院软件与服务外包学院

出处《计算机应用》 CSCD 北大核心 2008年第8期2088-2090,共3页 journal of Computer Applications

基金江苏省教育厅哲学社会科学基金指导项目(06SJD630042) 南京审计学院校级科研项目(NSK2008/B10)

关键词固有维数估计极大似然估计降维 intrinsic dimension estimation Maximum Likelihood Estimation （MLE） dimension reduction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1KRISHNAIAH P, KANAL L. Handbook of Statistics [ M]. Amsterdam : North-Holland, 1982.
2CAMASTRA F. Data dimensionality estimation methods: a survey [J]. Pattern Recognition, 2003, 36(12): 2945-2954.
3FUKUNAGA K, OLSEN D R. An algorithm for finding intrinsic dimensionality of data [J]. IEEE Transactions on Computers, 1976, 20 (2): 165 -171.
4PETTIS K, BAILEY T, JAIN T, et al. An intrinsic dimensionality estimator from near-neighbor information[ J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 1979, 1 (1) : 25 -37.
5CAMASTRA F, VINCIARELLI A. Estimating the intrinsic dimension of data with a fractal-based method [ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24 (10) : 1404 - 1407.
6LEVINA E, BICKEL P. Maximum likelihood estimation of intrinsic dimension[ EB/OL]. [ 2007 - 08 - 23]. http://www, star. berkeley. edu/-bickel/mldim, pdf.
7DAVID J C M, GHAHRAMANI Z. Maximum likelihood estimation of intrinsic dimension[ EB/OL]. [ 2007 - 08 - 23]. http://www, inference, phy. cam. ac. uk./mackay/dimension/
8KEGL B. Intrinsic dimension estimation using packing numbers [ EB/OL]. [ 2007 - 08 - 26]. http://books, nips. cc/papers/files/ nips15/AA25, pdf.
9TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [ J]. Science, 2000, 290(5500) : 2319 -2323.

同被引文献7

1惠康华,李春利,王雪扬,许新忠.基于流形学习的“本质”维数估计[J].计算机科学,2012,39(S3):212-214. 被引量：4
2谭璐,吴翊,易东云.基于LLE方法的本征维数估计[J].模式识别与人工智能,2006,19(1):7-13. 被引量：7
3文贵华,江丽君,文军.邻域参数动态变化的局部线性嵌入[J].软件学报,2008,19(7):1666-1673. 被引量：35
4高小方.流形学习方法中的若干问题分析[J].计算机科学,2009,36(4):25-28. 被引量：15
5罗芳琼.LLE流形学习的若干问题分析[J].现代计算机（中旬刊）,2012(3):13-16. 被引量：5
6邵超,万春红,赵静玉.流形学习算法中邻域大小参数的递增式选取[J].计算机工程,2014,40(8):194-200. 被引量：2
7杨志伟,黄秀云.基于LLE的数据降维方法研究[J].中小企业管理与科技,2014(25):197-200. 被引量：4

引证文献1

1李芳,高翔.LLE算法中有关参数选取问题的研究[J].统计学与应用,2017,6(1):7-16. 被引量：2

二级引证文献2

1蓝雯飞,汪敦志,张盛兰.一种新的降维算法PCA_LLE在图像识别中的应用[J].中南民族大学学报（自然科学版）,2020,39(1):85-90. 被引量：7
2王波,刘太安,樊建聪,孙小川,刘欣颖.基于局部线性嵌入极限学习机的人脸识别新方法[J].计算机应用与软件,2020,37(3):178-183. 被引量：5

1蒲玲.自适应局部线性降维方法[J].计算机应用与软件,2013,30(4):255-257. 被引量：5
2刘遵仁,吴耿锋.基于邻域粗糙模型的高维数据集快速约简算法[J].计算机科学,2012,39(10):268-271. 被引量：11
3邵超,万春红,陈广宇.基于最小连通邻域图的ISOMAP算法[J].计算机应用,2007,27(10):2570-2574. 被引量：2
4白莹琦,彭进业,王大凯,邢天璋.基于绝对最小Lipschitz延拓的图像编码算法[J].计算机工程,2010,36(2):206-208.
5王广斌,杜晓阳,罗军.面向转子故障特征提取的多尺度拉普拉斯特征映射方法[J].中国机械工程,2016,27(20):2791-2797. 被引量：3
6赵连伟,罗四维,赵艳敞,刘蕴辉.高维数据流形的低维嵌入及嵌入维数研究[J].软件学报,2005,16(8):1423-1430. 被引量：54

计算机应用

2008年第8期

浏览历史

内容加载中请稍等...

高维数据固有维数的自适应极大似然估计被引量：1

参考文献9

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

高维数据固有维数的自适应极大似然估计 被引量：1

参考文献9

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

高维数据固有维数的自适应极大似然估计被引量：1