基于线性判别分析和二分K均值的高维数据自适应聚类方法被引量：1

Adaptive clustering method based on linear discriminant analysis and bisecting K-means for high dimensional data

下载PDF

导出

摘要将线性判别分析和二分K均值聚类耦合在一起,提出了一个适合于高维数据聚类的自适应方法:利用线性判别分析将高维数据集变换成低维数据集,然后在低维数据集上执行二分K均值聚类,并把得到的聚类结果通过一个簇成员指示矩阵H变换到原数据集中.将这样的过程反复进行,直到自适应地得到一个最优结果.基于现实数据集的实验结果证明了该方法的有效性. Combining linear discriminant analysis（LDA） and bisecting K-means clustering（BKM）,an adaptively clustering method was proposed for high dimensional data.The method uses LDA to transform the high dimensional dataset into low dimensional one,applies BKM on the low dimensional dataset,and constructs the clusters in the original high dimensional dataset.The method is adaptively executed to generate the best result.Extensive experimental results on real-world datasets showed the effectiveness of the approach.

作者汪万紫裘国永张兵权

机构地区陕西师范大学计算机科学学院

出处《郑州轻工业学院学报（自然科学版）》 CAS 2011年第2期106-110,共5页 Journal of Zhengzhou University of Light Industry:Natural Science

基金陕西省自然科学基金项目(2010JM8039)

关键词维归约线性判别分析二分K均值高维数据自适应聚类方法 dimension reduction LDA bisecting K-means adaptive clustering method for high dimensional data

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1贺玲,蔡益朝,杨征.高维数据聚类方法综述[J].计算机应用研究,2010,27(1):23-26. 被引量：42
2余元辉,邓莹.一种新的高维数据聚类自适应算法的研究[J].沈阳化工大学学报,2010,24(2):165-169. 被引量：1
3Ding C,He X,Zha H,et al.Adaptive dimension reduction for clustering high dimensional data[C] //Proc IEEE Int'l Conf Data Mining,Washington DC:IEEE Computer Society,2002.
4唐懿芳,钟达夫.主成分分析方法对数据进行预处理[J].广西师范大学学报（哲学社会科学版）,2002,38(S1):223-225. 被引量：16
5Berry M W.Large scale singular value computations[J].Int J of Supercomp Appli,1992,6(1):13.
6Loris Nanni,Alessandra Lumini.Orthogonal linear discriminant analysis and feature selection for micro-array data classification[J].Expert Syst with Appli,2010,37(10):7132.
7Steinbach M,Karypis G,Kumarv.A comparison of document clustering techniques[C] //Proc of the Sixth ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining(KDD 2000),Boston:MA,2000:20-23.
8Li T,Ma S.IFD:Iterative feature and data clustering[C] //Proc SIAM Int'l Conf on Data Mining(SDM 2004),Florida:Society of Industrial and Applied Mathematics,2004:472-476.

二级参考文献36

1洪志令 ,姜青山 ,董槐林 ,Wang Sheng-Rui .模糊聚类中判别聚类有效性的新指标[J].计算机科学,2004,31(10):121-125. 被引量：15
2ERTOZ L, STEINBACH M, KUMAR V. Finding clusters of different sizes, shapes and densities in noisy high-dimensional data[ R]. Minnesota: Department of Computer Science, University of Minnesota, 2002.
3HAM J H, LEE D D, SAUL L K. Learning high-dimensional correspondences from low dimensional manifolds [ C ]//Proc of ICML Workshop on the Continuum from Labeled to Unlabeled Data in Machine Learning and Data Mining. Washington: [ s. n. ] , 2003:34-41.
4KOHONEN T. Self-organization and associated memory [ M]. [ S. l. ]: Springer-Verlag, 1988.
5KOHONEN T. Self-organizing maps [ M ]. New York: Spinger-Verlag, 2001.
6MINKA T P. Automatic choice of dimensionality for PCA[ C ]//Proc of International Conference on Advances in Neural Information Processing Systems. Cambridge: [ s. n. ] , 2001:598-604.
7GRIFFITHS T L, KALISH M L. A muhidimensional scaling approach to mental multiplication[ J ]. Memory & Cognition, 2002,30 ( 1 ) : 97-106.
8CAMASTRA F, VINCIARELLI A. Estimating the intrinsic dimension of data with a fractal-based method [J].IEEE Trans on Pattern Anal Mach Intell, 2002,24(10) :1404-1407.
9CAMASTRA F. Data dimension estimation methods: a survey[ J]. Pattern Recognition, 2003, 36:2945-2954.
10SCHOLKOPF B, SMOLA A, MULLER K. Nonlinear component analysis as a kernel eigenvalue problem [ J ]. Neural Computation, 1998,10(5) :1299-1319.

共引文献56

1劳亚民,刘登科,陈明明.基于主成分分析法的目标价值评估[J].舰船电子工程,2008,28(3):101-104. 被引量：2
2刘静波,林松毅,程胜.主成分分析方法综合评价功能食品抗疲劳和耐缺氧功效特性[J].中国食品学报,2006,6(1):212-217. 被引量：1
3洪利华,罗均平,刘已斌.基于主成分分析法的目标威胁评估[J].指挥控制与仿真,2006,28(2):49-52. 被引量：17
4林松毅,刘静波,叶海青.主成分分析方法在保健食品功能学评价中的应用研究[J].食品科学,2007,28(9):546-548. 被引量：8
5朱胜伟,周德云,李兆强.基于改进的主成分分析法的目标威胁评估[J].计算机仿真,2010,27(3):1-4. 被引量：12
6邢昊,王浩全,杜宇慧.基于K-L变换的PCA多模医学图象融合算法研究[J].微计算机信息,2010(14):202-203. 被引量：1
7龙草芳,辛玲.数据挖掘与统计方法[J].电脑知识与技术,2010,6(10):7884-7886. 被引量：2
8祝琴,高学东,武森,陈华.高维稀疏数据对象——属性空间分割[J].数学的实践与认识,2011,41(7):184-189. 被引量：1
9刘满君.主成分分析在人事考核中的应用[J].中国科技信息,2011(12):136-136. 被引量：1
10关树森,于春江,朱安林,江涛.额下经蝶入路显微手术切除鞍区肿瘤20例报告[J].中华神经外科杂志,1999,15(5):304-306. 被引量：37

同被引文献24

1周煜人,彭辉,桂卫华.基于映射的高维数据聚类方法[J].计算技术与自动化,2005,24(2):78-80. 被引量：1
2孙玉芬,卢炎生.一种基于网格方法的高维数据流子空间聚类算法[J].计算机科学,2007,34(4):199-203. 被引量：8
3张力生,贺改利,雷大江.基于幂图的离群子空间搜索算法[J].计算机应用研究,2011,28(8):2859-2861. 被引量：1
4蒋亦樟,王士同.基于方差权重矩阵模型的高维数据子空间聚类算法[J].计算机应用研究,2012,29(8):2868-2871. 被引量：3
5俞蓓,王军,叶施仁.基于近邻方法的高维数据可视化聚类发现[J].计算机研究与发展,2000,37(6):714-720. 被引量：7
6谢昆明,罗幼喜.一种改进的主成分分析特征抽取算法:YJ-MICPCA[J].武汉科技大学学报,2019,42(3):220-226. 被引量：5
7吴青,祁宗仙,臧博研,张昱.自适应局部稀疏线性嵌入降维算法[J].西安邮电大学学报,2019,24(2):67-71. 被引量：4
8张建朋,陈鸿昶,王凯,祝凯捷,王亚文.基于采样的大规模图聚类分析算法[J].电子学报,2019,47(8):1731-1737. 被引量：3
9万静,吴凡,何云斌,李松.新的降维标准下的高维数据聚类算法[J].计算机科学与探索,2020,14(1):96-107. 被引量：18
10伍哲,杨芳.时间加权的TF-LDA学术文献摘要主题分析[J].计算机技术与发展,2020,30(1):194-200. 被引量：4

引证文献1

1孙洁丽,刘沛,翟浩文.基于高维数据的聚类研究综述[J].河北省科学院学报,2022,39(5):1-6. 被引量：6

二级引证文献6

1魏东,杨洁婷,韩少然,朱准.基于XGBoost-神经网络的建筑负荷预测模型构建[J].科学技术与工程,2023,23(29):12604-12611. 被引量：2
2余彦,蔡霖,张冲,冀弘帅.基于密度聚类的复杂装备健康监测方法[J].指挥控制与仿真,2024,46(2):69-77.
3别春洋,陶贻勇.基于LightGBM和蚁群算法优化的特征选择方法[J].现代计算机,2024,30(4):34-38.
4潘忆瑕,张弘旭,颜继忠,张慧.基于高光谱与纹理特征融合的甘草药材基源鉴别研究[J].分析测试学报,2024,43(11):1745-1753.
5吕弢,陈璟,薛善烨.离散制造中基于多源多模数据的产品指标联合分析[J].空天防御,2024,7(5):110-119.
6张凌翱.基于XGBoost和蚁群算法的特征选择方法[J].计算机科学与应用,2023,13(4):883-889.

1谷瑞军,叶宾,须文波.基于谱聚类的两阶段颜色量化算法[J].中国图象图形学报,2007,12(10):1922-1925. 被引量：5
2张军伟,王念滨,黄少滨,蔄世明.二分K均值聚类算法优化及并行化研究[J].计算机工程,2011,37(17):23-25. 被引量：23
3王嘉旸,万青云,闫天伟.基于Hadoop的二分K均值改进算法[J].科技广场,2016(9):4-8.
4张洁玲,白清源.一种高效的K-means聚类改进算法[J].福州大学学报（自然科学版）,2014,42(4):537-542. 被引量：5
5刘广聪,黄婷婷,陈海南.改进的二分K均值聚类算法[J].计算机应用与软件,2015,32(2):261-263. 被引量：25
6张娇,裘国永,张奇.基于二分K均值的SVM决策树的高维数据分类方法[J].赤峰学院学报（自然科学版）,2012,28(7):13-15. 被引量：1
7黄金垒,王衡军,郁滨.一种基于凝聚度的报警处理算法[J].系统仿真学报,2017,29(4):859-864. 被引量：2
8柳辉,李鹭扬.SCARA机器人的仿真分析[J].农业装备技术,2016,42(4):41-43. 被引量：1
9李国朋,潘志松,姚清,李德毅.融合先验信息的非负矩阵分解社区发现算法[J].模式识别与人工智能,2016,29(7):608-615. 被引量：6
10李关健,陈文家,王汝梦.基于MATLAB的六轴工业机器人的分析[J].农业装备技术,2016,42(3):53-55. 被引量：2

郑州轻工业学院学报（自然科学版）

2011年第2期

浏览历史

内容加载中请稍等...

基于线性判别分析和二分K均值的高维数据自适应聚类方法被引量：1

参考文献8

二级参考文献36

共引文献56

同被引文献24

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于线性判别分析和二分K均值的高维数据自适应聚类方法 被引量：1

参考文献8

二级参考文献36

共引文献56

同被引文献24

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于线性判别分析和二分K均值的高维数据自适应聚类方法被引量：1