基于相似度的网格聚类算法被引量：12

Similarity-based Grid Clustering Algorithm

下载PDF

导出

摘要提出了一种基于相似度的网格聚类算法(SGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用边界点阈值函数提取类的边界点,最后利用相似度方法进行聚类。SGCA算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,它不仅适用于综合数据集,而且对高维数据集也具有较好的聚类结果。还引进了网格核技术,进一步改善了SGCA算法的时间复杂度。 This paper presents a Similarity-based Grid Clustering Algorithm （SGCA）.The SGCA removes some outliers or noises in the dataset by the technique of grid and disposes of border points of clusters by the method of the threshold function of border points.The SGCA clusters by the method of similarity.Scanning the dataset only once,the SGCA can discover clusters of arbitrary shapes.The experiment results show that it can discover outliers or noises effectively and get good cluster quality.The SGCA is not only suitable for some synthetic datasets,but also has better clustering results in some high dimensional datasets.In order to improve the efficiency of SGCA,the technique of grid cores-based is used in this paper.

作者刘敏娟柴玉梅张西芝

机构地区郑州大学信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2007年第7期198-201,共4页 Computer Engineering and Applications

基金河南省自然科学基金(the Natural Science Foundation of Henan Province of China under Grant No.021105110)

关键词网格相似度闽值函数核 grid similarity threshold function cores

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Kaufman L,Rousseeuw P J.Finding groups in data:an introduction to cluster analysis[M].New York:John Wiley & Sons,1990.
2Ankerst M,Breunig M,Kriegel H P.OPTICS:Ordering points to identify the clustering structure[C]//Proc ACM SIGMOD Int Conf on Management of Data,Philadelphia,PA,1999:49-60.
3Ester M,Kriegel H P,Sander J.A density-based algorithm for discovering clusters in large spatial databases[C]//Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining,1996,8:226-231.
4Wang W,Yang J,Muntz R.STING:a statistical information grid approach to spatial data mining[C]//Proceedings of the 23rd International Conference on Very Large Databases,AThens,Greece,1997:186-195.
5Sheikholeslami G,Chatterjee S,Zhang A.WaveCluster:a multi-resolution clustering approach for very large spatial databases[C]//Proc1998 Int Conf Very Large Data Bases,New York,1998:428-439.
6Agrawal R,Gehrke J,Gunopulos D.Automatic subspace clustering of high dimensional data for data mining applications[C]//ACM SIGMOD International Conference on Management of Data,Seattle,WA,1998:94-105.
7Han Jia-wei,Kamber M.Data mining:concepts and techniques[M].New York:Morgan Kanfmann Publishers,2000.
8Chen Ling,Tn Li,Chen Hong-jian.Data clustering by ant colony on a digraph[C]//Proceedings of the Fourth International Conference on Machine Learning and Cybernetics,Guangzhou,August 2005:1686-1692.
9Ertoz L,Steinbach M,Kumar V.Finding clusters of different sizes,shapes,and densities in noisy,high dimensional data[C]//SIAM International Conference on Data Mining,2003:42-47.
10Hsu Chih-ming,Chen Ming-syan.Subspace clustering of high dimensional spatial data with noises[M].Heidelberg.Germany:Springer,2004:31-40.

同被引文献113

1吴泓辰,王新军,成勇,彭朝晖.基于协同过滤与划分聚类的改进推荐算法[J].计算机研究与发展,2011,48(S3):205-212. 被引量：20
2田启明,王丽珍,尹群.基于网格距离的聚类算法的设计、实现和应用[J].计算机应用,2005,25(2):294-296. 被引量：12
3孙晓鹏,李华.三维网格模型的分割及应用技术综述[J].计算机辅助设计与图形学学报,2005,17(8):1647-1655. 被引量：49
4郭俊,樊彦国.一种改进的CURE聚类算法[J].内蒙古石油化工,2005,31(8):12-15. 被引量：4
5吴琪,高滢,王晓涛,左万利.一种基于距离的增量聚类算法[J].解放军理工大学学报（自然科学版）,2005,6(6):537-540. 被引量：3
6裘国相,汪思源,王文标.数据挖掘在火电厂运行优化目标值确定中的应用[J].自动化技术与应用,2006,25(3):6-9. 被引量：18
7李润梅,宫晓燕.面向动态交通分配的城市道路网络分区研究[J].中国科学院研究生院学报,2006,23(4):520-526. 被引量：4
8邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
9赖建章,倪志伟,刘志伟.一种基于密度树的网格快速聚类算法的研究[J].计算机工程,2006,32(17):69-70. 被引量：4
10刘俊岭,孙焕良,王大玲,牛志成.一种优化的基于网格的聚类算法[J].小型微型计算机系统,2006,27(10):1927-1930. 被引量：6

引证文献12

1庞春江,程伟想,牛为华.基于优化网格的最小生成树聚类算法[J].计算机应用与软件,2009,26(8):262-264.
2李晓丹,储浩,杨晓光.城市道路网络交通小区概念解析[J].武汉理工大学学报（交通科学与工程版）,2009,33(5):972-975. 被引量：1
3何扬名,戴曙光.网格和密度聚类方法在人头检测中的应用[J].计算机工程与应用,2009,45(31):145-146. 被引量：1
4杨竹苹,黄琦志,梁海珍,陈琪.一种可用于数据集优化的网格相似度聚类算法研究[J].军事交通学院学报,2010,12(3):77-80.
5赵慧,刘希玉,崔海青.网格聚类算法[J].计算机技术与发展,2010,20(9):83-85. 被引量：28
6罗静,刘宗歧.基于网格聚类算法的电力营销预测研究[J].科技信息,2011(13):366-367. 被引量：5
7王教东.初探云计算在军交运输信息化过程中的应用[J].军事交通学院学报,2012,14(7):69-72. 被引量：2
8秦绪华,王秋平,陈志强.基于改进k-means算法的电站最优外部运行工况划分[J].热力发电,2017,46(6):28-33. 被引量：7
9邢长征,张园.基于密度与网格的聚类算法的改进[J].计算机工程与应用,2016,52(22):81-85. 被引量：2
10邵伦,周新志,赵成萍,张旭.基于多维网格空间的改进K-means聚类算法[J].计算机应用,2018,38(10):2850-2855. 被引量：15

二级引证文献62

1张明宇,齐瑞锋,王强,刘峰.喷杆机械臂障碍物检测系统设计与性能测试[J].中国农业信息,2021,33(2):49-56. 被引量：2
2何佃伟,杨承志,张荣,吴宏超.一种基于改进网格聚类的雷达信号分选算法[J].雷达与对抗,2011,31(2):43-45. 被引量：11
3贾佳.基于网格密度的带有层次因子的聚类算法[J].计算机技术与发展,2012,22(6):10-13. 被引量：1
4邱磊,杨承志,何佃伟,陈昊.一种基于改进网格聚类的雷达信号预分选算法[J].电子信息对抗技术,2012,27(5):14-17. 被引量：2
5刘敏娟,于景茹,张西芝.一种基于网格密度的聚类算法[J].软件导刊,2012,11(12):56-57.
6邱磊,杨承志,何佃伟.一种新的基于网格聚类的雷达信号预分选算法[J].现代防御技术,2013,41(2):167-172. 被引量：5
7李星雨,杨承志,曲文韬,张荣.基于自适应网格密度聚类的雷达信号分选算法[J].航天电子对抗,2013,29(2):50-53. 被引量：2
8邢笑雪,姜利.基于PCA与KPCA的基因数据的特征简约[J].长春大学学报,2013,23(12):1525-1527. 被引量：2
9顾骋,钱惟贤,陈钱,顾国华,任建乐.基于双目立体视觉的快速人头检测方法[J].中国激光,2014,41(1):150-155. 被引量：25
10徐卫东,刘祖德.基于云计算的企业安全管理趋势研究[J].安全与环境工程,2014,21(3):86-89. 被引量：6

1葛丽娜,钟诚.一个有效的分布式并行挖掘关联规则算法[J].计算机工程与设计,2004,25(8):1258-1260. 被引量：6
2刘旭东,葛俊杰,陈德人.一种基于聚类和协同过滤的组合推荐算法[J].计算机工程与科学,2010,32(12):125-127. 被引量：13
3孙锐,金澎.一种大规模中文搜索日志的层次聚类方法[J].科技通报,2012,28(8):83-85. 被引量：2
4周粳迪,程东年,刘勤让.报文分类算法可扩展性标准评测系统[J].计算机工程与设计,2009,30(18):4141-4145.
5颜轲,万国伟,李思昆.基于图像分割的立体匹配算法[J].计算机应用,2011,31(1):175-178. 被引量：12
6艾剑锋.反射机制在数据库系统中的应用[J].科技广场,2005(3):52-54. 被引量：1
7沙拉.instapaper 让阅读变得更简单[J].电脑爱好者,2014(2):83-83.
8田地,张西芝,刘小航.一种基于扩展的K-means聚类算法[J].河南教育学院学报（自然科学版）,2007,16(2):26-28. 被引量：3
9聂永芳,许家宝.多用途抓取类机械手设计及分析[J].煤矿机械,2016,37(12):83-85. 被引量：5
10廖一星,潘雪增.文本分类中基于逆云模型的特征选择方法[J].大连海事大学学报,2011,37(4):75-77.

计算机工程与应用

2007年第7期

浏览历史

内容加载中请稍等...

基于相似度的网格聚类算法被引量：12

参考文献10

同被引文献113

引证文献12

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

基于相似度的网格聚类算法 被引量：12

参考文献10

同被引文献113

引证文献12

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

基于相似度的网格聚类算法被引量：12