自然最近邻密度聚类算法的改进方法

An Improved Method to Clustering Algorithm of Natural Nearest Neighbor Density

下载PDF

导出

摘要自然最近邻算法(TNDP)所得结果的类内差异很小,若待分类集合元素较多,则可能出现过度分割问题——具有相似特征元素的子集被分割为多个小类。为此,在使用TNDP算法后,若类内平方和差分小于给定的阀值,就把距离最近的两个子类合并为一个大类,如此反复,直到类间的距离足够大为止。这可保证“具有相似特征元素的多个子类”合并为一个较大类,从而提高最终分类结果的可解释性。 Since the results of the natural nearest neighbor algorithm(TNDP)have small intra-class differences,if there are many elements in the set to be classified,there may be an over-segmentation problem,a subset of elements with similar characteristics is divided into multiple small classes.This article suggests that after using the TNDP algorithm,if the difference of the sum of squares within the classes is less than a given threshold,the closest two subclasses can be combined into a new big class.Do this until the distance between each class is large enough.This can often ensure that"multiple classes with similar feature elements"are merged into one larger category,thereby improving the interpretability of the final classification result.

作者李俊海 LI Junhai(College of Science,Henan University of Technology,Zhengzhou 450007,China)

机构地区河南工业大学理学院

出处《新乡学院学报》 2020年第12期38-42,共5页 Journal of Xinxiang University

基金河南省高等学校重点科研项目(20B416001)。

关键词自然最近邻居密度聚类算法类间相似度 natural nearest neighbor clustering algorithm based on density similarity between clusters

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1金辉,钱雪忠.自然最近邻优化的密度峰值聚类算法[J].计算机科学与探索,2019,13(4):711-720. 被引量：22
2胡建军,唐常杰,李川,彭京,元昌安,陈安龙,蒋永光.基于最近邻优先的高效聚类算法[J].四川大学学报（工程科学版）,2004,36(6):93-99. 被引量：24

二级参考文献8

1Han J W, Kambr M. Data mining concepts and techniques[M]. Beijing: Higher Education Press, 2001. 145～176.[2]Kaufan L, Rousseeuw P J. Finding groups in data: an introduction to cluster analysis[M]. New York: John Wiley & Sons, 1990.
2Guha S, Rastogi R, Shim K. CURE: an efficient clustering algorithm for large databases[A]. Haas L M, Tiwary A. Proceedings of the ACM SIGMOD International Conference on Management of Data[C]. Seattle: ACM Press, 1998. 73～84.
3Ester M, Kriegel H P, Sander J, et al. A density based algorithm for discovering clusters in large spatial databases with noise[A]. Simoudis E, Han J W, Fayyad U M. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining[C].
4Agrawal R, Gehrke J, Gunopolos D, et al. Automatic subspace clustering of high dimensional data for data mining application[A]. Haas L M, Tiwary A. Proceedings of the ACM SIGMOD International Conference on Management of Data[C]. Seattle: ACM Press, 1998.
5Zhang T,Ramakrishnan R,Livny M. BIRCH:an efficient data clustering method for very large database[R].Computer Sciences Dept,Univ of Wisconsin-Madison,1995.
6Zhang T,Ramakrishnan R,Livny M. BIRCH:an efficient data clustering method for very large databases[A]. Jagadish H V, Mumick I S. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data[C]. Quebec: ACM Press, 1996.103～114.
7Beyer K S,Goldstein J,Ramakrishnan R,et al. When is 'nearest neighbor' meaningful?[A].Beeri C,Buneman P.Proceedings of the 7th International Conference on Data Theory[C].ICDT'99. LNCS1540,Jerusalem, Israel: Springer, 1999.217～235.
8Karypis G,Han E H,Kumar V. CHAMELEON: a hierarchical clustering algorithm using dynamic modeling[J].IEEE Computer,1999,32(8):68-75.

共引文献44

1徐鹏飞,张华,贾剑平.一种新的水下焊缝图像信号提取方法[J].上海交通大学学报,2008,42(S1):97-99. 被引量：2
2魏大刚,唐常杰,段磊,钟义啸,朱军,蒋永光.基于最优投影和动态阈值的最近邻搜索算法[J].四川大学学报（自然科学版）,2006,43(4):777-782. 被引量：2
3吴青,翟建设,赵旭赟.基于层次聚类的分层可扩展性编码算法的优化[J].计算机应用与软件,2007,24(2):45-46. 被引量：4
4漆超,江嘉.基于数据挖掘技术的网站用户分析[J].昆明理工大学学报（理工版）,2007,32(2):48-51. 被引量：2
5胡建军.浅谈数据仓库与数据挖掘的本科教学[J].广西科学院学报,2007,23(3):209-210. 被引量：9
6禹亮,李仁发,李仲生,肖娜.基于近邻可视的图像浏览方式研究[J].计算机应用研究,2007,24(10):200-202.
7李双伟,范斗,王康元,邱家驹,鄢安河.基于数据分区的负荷密度显示的实现[J].继电器,2008,36(3):42-44. 被引量：1
8李广霞,朱峰,王占锋,崔哲.基于数据挖掘的入侵检测的研究与应用[J].石家庄职业技术学院学报,2007,19(6):33-36.
9王志坚,蔡自兴.一种基于Petri网的功能／数据分析方法[J].计算机集成制造系统,2008,14(6):1194-1199. 被引量：3
10陆林花.一种新的基于遗传算法的动态聚类算法[J].计算机仿真,2009,26(7):122-125. 被引量：5

1钟彩,彭春富,杜微,杨兴耀.一种图像分类识别算法的研究[J].电子技术与软件工程,2020(18):130-131.
2许锴.基于RFID技术的图书馆智能管理系统[J].现代电子技术,2020,43(23):6-10. 被引量：12
3谷浩荣.基于深度学习的图像语义分割方法综述[J].科学与信息化,2020(32):178-178.
4王群勇,李仲武,冯学良.身份、性别与幸福——基于家庭层面的分析[J].世界经济文汇,2020(5):105-120. 被引量：11
5熊飞,聂川杰,李骏驰,严冬,陈晓雷.电力电子变压器的内部能量流动协调控制策略[J].电力系统自动化,2020(15):127-143. 被引量：8
6宋春山,朱新宇,韩红卫,林立邦,姚植.河道特征对黑龙江上游冰坝生消影响[J].水利学报,2020,51(10):1256-1266. 被引量：8
7王宁宁,孙瑞驰,魏光春.基于单片机的雨天自动关窗系统设计[J].信息通信,2020(8):152-154. 被引量：1
8王泽文,王广君,刘小波,佘锦华.L2范式距离的星图识别方法[J].红外与激光工程,2020,49(10):234-240. 被引量：1
9谭红芳.自突触对HH神经元正弦信号响应的调节[J].甘肃科技,2020,36(20):55-57. 被引量：1
10席志红,占梦奇.基于位置范围限定的WiFi-KNN室内定位算法[J].应用科技,2020,47(4):66-70. 被引量：7

新乡学院学报

2020年第12期

浏览历史

内容加载中请稍等...

自然最近邻密度聚类算法的改进方法

参考文献2

二级参考文献8

共引文献44

相关作者

相关机构

相关主题

浏览历史