一种可用于数据集优化的网格相似度聚类算法研究

Research on Grid Similarity- based Clustering Algorithm Used in Data Set Optimization

下载PDF

导出

摘要针对传统对象间相似度的度量方法的缺陷，提出了一种改进的网格相似度聚类算法。该算法引入了新的相似度度量标准，并使用密度阈值处理技术来定义网格的密度阈值，提高了聚类的精度。同时还利用信息熵的概念对高维数据集进行了处理，对数据集的维度具有很好的扩展性。在与传统算法的对比实验中显示出一定的优越性。 Aimed at the limitations of traditional measurement method on similitude among objects, an improved grid simi- larity -based clustering algorithm is put forward. It draws a new criterion to measure the similitude among objects, and defines the density threshold of grid by processing technology of density threshold to improve the precision of clustering. Besides, high dimensional data set is disposed by the technique of information entropy, it has the advantage over the tradi- tional clustering algorithm.

作者杨竹苹黄琦志梁海珍陈琪

机构地区军事交通学院汽车指挥系武警指挥学院模拟中心

出处《军事交通学院学报》 2010年第3期77-80,共4页 Journal of Military Transportation University

关键词网格相似度数据集熵聚类算法 grid similitude data set entropy clustering algorithm

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1田启明,王丽珍,尹群.基于网格距离的聚类算法的设计、实现和应用[J].计算机应用,2005,25(2):294-296. 被引量：12
2邱保志,刘洋,陈本华.基于网格熵的边界点检测算法[J].计算机应用,2008,28(3):732-734. 被引量：7
3刘敏娟,柴玉梅,张西芝.基于相似度的网格聚类算法[J].计算机工程与应用,2007,43(7):198-201. 被引量：12
4XU Zhiming,CHEN Mingxian.Subspaee Clustering of High Dimensional Spatial Data with Noises[C]//LNAI3056.Beding,2004:31-40.
5LeventE rtOz,Michael Steinbach,Vipin Kumar.Finding Clusters of Different Sizes,Shapes,and Densities in Noisy,High Di-mensional Data[C]//International Conference on Data Mining.San Francisco,2003:166-177.

二级参考文献27

1邱保志,沈钧毅.网格聚类中的边界处理技术[J].模式识别与人工智能,2006,19(2):277-280. 被引量：13
2邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
3Han J W Kamber M 范明孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版杜,2001.147-158.
4KAUFMAN L, ROUSSEEUW PJ. Finding Groups in Data: An Introduction to Cluster Analysis[ Z]. New York: John Wiley & Sons, 1990.
5ESTER M, KRIEGEL H-P, SANDER J, et al. A density-based algorithm For discovering clusters in large spatial databases[ J]. In Proc1996 Int Conf Knowledge Discovery and Data Mining( KDD'96), 1996, 8:226 -231.
6ANKERST M, BREUNIG M, KRIEGEL H-P, et al. OPTICS : Ordering points to identify the clustering structure[ A]. In Proc1999 ACM-SIGMOD Int Conf Management of Data(SIGMODX)9) [ C].Philadelphia, PA, 1999. 49 - 60.
7WANG W, YANG J, MUNTZ R. STING: A statistical inFormation grid approach to apatial data mining[ A]. In Proc 1997 Int Corff Very Large Data Bases(VLDB'97) [ C]. AThens, Greece, 1997. 186 - 195.
8SHEIKHOLESLAMI G, CHATTERJEE S, ZHANG A. Wave Cluster: A multi-resolution clustering approach For very. large spatial databases [ A]. In Proc 1998 Int Conf Very Large Data Bases(VLDB'98) [ C]. New York, 1998. 428 -439.
9AGRAWAL R, GEHRKE J , GUNOPULOS D , et al. Automatic subspace clustering of high dimensional data For data mining applications[ A]. In Proc 1998 ACM-SIGMOD Int Cord Management of Data(SIGMOD'98) [ C]. Seattle, WA, 1998.94 - 105.
10FISHER D. Improving inference through conceptual clustering[ A].In Proc 1987 AAAI Conf[C]. Seattle, WA, 1987.461 -465.

共引文献28

1刘玉军,房爱忠,何渝兰,杨洪路.移动网络相对定位算法研究[J].计算机工程与设计,2006,27(10):1811-1813. 被引量：1
2张光建,黄贤英.基于最小聚类单元的聚类算法研究及其在CRM中的应用[J].计算机科学,2006,33(7):188-189. 被引量：11
3舒红平,王运锋,徐振明,邹书蓉.基于K-均值聚类的多雷达数据融合算法研究[J].计算机工程与应用,2007,43(16):183-185. 被引量：3
4舒红平,徐振明,邹书蓉,何嘉.网格聚类在多雷达数据融合算法中的应用[J].电子科技大学学报,2007,36(6):1253-1256. 被引量：3
5聂舟,程远国.一种基于平均相对偏差的聚类算法[J].兵工自动化,2008,27(8):32-34. 被引量：2
6孟建良,程伟想,牛为华.基于网格距离的高精度聚类算法[J].计算机应用与软件,2009,26(6):262-264. 被引量：4
7庞春江,程伟想,牛为华.基于优化网格的最小生成树聚类算法[J].计算机应用与软件,2009,26(8):262-264.
8李晓丹,储浩,杨晓光.城市道路网络交通小区概念解析[J].武汉理工大学学报（交通科学与工程版）,2009,33(5):972-975. 被引量：1
9何扬名,戴曙光.网格和密度聚类方法在人头检测中的应用[J].计算机工程与应用,2009,45(31):145-146. 被引量：1
10赵慧,刘希玉,崔海青.网格聚类算法[J].计算机技术与发展,2010,20(9):83-85. 被引量：29

1李村合,冯静.一种改进的KNN网页分类算法[J].微计算机应用,2008,29(3):21-25. 被引量：3
2郭鑫,李云,黄云,周清平.最小闭树特征集的聚类与分类方法[J].计算机应用,2010,30(2):423-426. 被引量：5
3张玉宁,樊银芳.基于相似度聚类与免疫危险理论的入侵检测方法研究[J].宁夏师范学院学报,2008,29(6):54-57.
4卢艳宏.基于负载平衡的无线传感器网络路由算法[J].科技广场,2012(7):65-69.
5何信振,胡维华,郑秋华.一种基于警报数据关联的入侵检测系统模型[J].计算机工程与科学,2009,31(8):30-32. 被引量：3
6罗崇伟,张立臣.基于车联网的虚假数据检测模型[J].计算机工程与设计,2013,34(6):2272-2276. 被引量：1
7王丽娜,徐巍,刘铸.基于相似度聚类分析方法的异常入侵检测系统的模型及实现[J].小型微型计算机系统,2004,25(7):1333-1336. 被引量：16
8胡三宁.一种基于相似度的混合推荐方法[J].三门峡职业技术学院学报,2015,14(2):140-144. 被引量：2
9王晓英,靳力,王晓青,黄维通.基于序列匹配的作业相似度检测系统[J].计算机工程,2012,38(24):53-56. 被引量：9
10刘小平.网格计算系统及其安全技术[J].东方企业文化,2010(3X):53-53.

军事交通学院学报

2010年第3期

浏览历史

内容加载中请稍等...

一种可用于数据集优化的网格相似度聚类算法研究

参考文献5

二级参考文献27

共引文献28

相关作者

相关机构

相关主题

浏览历史