基于相似性度量的高维聚类算法的研究被引量：4

Research on High Dimensional Clustering Algorithm Based on Similarity Measure

下载PDF

导出

摘要针对高维数据相似度难以定义的问题,本文提出了一种新的高维数据聚类算法。该算法基于一个能够更准确表达高维数据对象之间相似性的度量函数,首先计算对象两两之间的相似度并得出一个相似度矩阵,然后根据该相似度矩阵自底向上对数据进行聚类分析。实验显示,该算法能够获得质量更高的聚类结果,并且不受孤立点影响,对数据输入顺序也不敏感。 Facing the difficult problem of how to define similarity measure for high dimensional data, a new high dimensional clustering algorithm is designed in this paper. This new clustering algorithm is based on a new similarity measure function, which can more accurately to express the similarity degree among the high dimensional data. The executing process of the algorithm is followed： firstly it uses the similarity measure function to compute the similarity degree for each high dimensional data to obtain the similarity matrix, and then conducts the cluster analysis based on the similarity matrix by the Bottom-up method. The experiment shows that this algorithm can improve the clustering analysis accurately and effectively, and will not be influent by the outliers. This algorithm is also insensitive to the input order of the data.

作者黄斯达陈启买

机构地区华南师范大学计算机学院

出处《微计算机信息》 2009年第27期187-188,198,共3页 Control & Automation

关键词高维数据聚类分析相似性度量 high dimension data cluster analysis similarity measure

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Jiawei Han,Micheline Kamber(著),范明,孟小峰(译).数据挖掘概念与技术[M].北京:机械工业出版社,2007.3.2.
2贺玲,吴玲达,蔡益朝.高维空间中数据的相似性度量[J].数学的实践与认识,2006,36(9):189-194. 被引量：20
3Agrawal R, Gehrke J. Gunopolos D, et al. Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. In ACM SIGMOD Conference, 1998.
4Sudipto Guha,Rajeev Rastogi,Kyuseok Shim. CURE: An Efficient Clustering Algorithm for Large Databases [A].Proceedings of the ACM SIGMOD international conference on Management of data [C].New York:ACM Press,1998.73-84.
5Galliat, Tobias. Adaptive Multilevel Cluster Analysis by Self- Organizing Box Maps [EB/OL],2002, http://www.diss.fu-berlin.de/ diss/receive/FUDISS_thesis_000000000679.
6陈良维.数据挖掘中聚类算法研究[J].微计算机信息,2006(07X):209-211. 被引量：32

二级参考文献15

1汪祖媛,庄镇泉,王煦法.逐维聚类的相似度索引算法[J].计算机研究与发展,2004,41(6):1003-1009. 被引量：5
2荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
3韩家炜 Michelin K.数据挖掘:概念与技术[M].北京:机械工业出版社,2001..
4A. K. J ain , R. C. Dubes. Algorithm for Clustering Data[C].Prentice Hall, 19881
5Kanungo T, Mount DM, Netanyahu NS. An efficient k-menas clustering algorithm: analysis and implementation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(7):881-892.
6Kohonen T. The Self-Organizing Maps[J]. Proceedings of the IEEE, 1990,78(9):1464-1480.
7Kohonen T. Self organization of a massive document collection[EB/OL].http://lib.hut.fgDiss/2000/isbn95122.52600/articl -e7.pdf,2000.
8Yannis Sismanis. Nick Roussopoulos. The dwarf data cube eliminates the high dimensionality eurse[R]. TR-CS4552. University of Maryland, 2003.
9Pitor Indyk. Rajeev Motvani. Approximate nearest neighbo::s: Toward removing the curse of dimensionality[C].In ACM Symposium on Theory of Computing. 1998.
10Bellmann R. Adaptive Control Processes: A Guided Tour[M]. Princeton University Press. 1961.

共引文献113

1柳炳祥,李海林.一种基于云模型的综合评判方法[J].微计算机信息,2007,23(32):262-263. 被引量：16
2刘茂.一种基于模糊神经网的超短波信号自动识别算法[J].成都信息工程学院学报,2007,22(5):588-592.
3王核成,林晓.基于聚类分析方法的区域大中型工业企业自主创新能力的划分[J].工业技术经济,2007,26(11):108-110. 被引量：3
4陈步英.数据挖掘技术在机械设备更新决策中的应用[J].拖拉机与农用运输车,2008,35(1):6-7.
5王核成,林晓.对浙江省自主创新能力的分析[J].统计与决策,2008,24(4):106-108. 被引量：1
6文贵华.面向机器学习的相对变换[J].计算机研究与发展,2008,45(4):612-618. 被引量：10
7张斌,苏一丹,曹波.基于蚁群聚类模型的增量式Web用户聚类[J].微计算机信息,2008,24(15):231-233. 被引量：3
8李业刚,宋道金,王淑君,赵公波.农业电子商务中模糊数据挖掘技术的应用[J].农机化研究,2008,30(1):178-180. 被引量：8
9田慧,刘希玉,李章泉.一种基于粗糙集的加权聚类算法[J].微计算机信息,2008,24(27):239-240. 被引量：3
10程国建,王晓燕.基于涌现自组织映射的聚类分析与可视化处理[J].微计算机信息,2008,24(27):257-259. 被引量：1

同被引文献54

1鲍江峰,夏仁学,彭抒昂.生态因子对柑桔果实品质的影响[J].应用生态学报,2004,15(8):1477-1480. 被引量：75
2YANGXiaomei,LANRongqin,DUYunyan,CHENXiufa.Technical foundation research on high resolution remote sensing system of China's coastal zone[J].Acta Oceanologica Sinica,2004,23(1):109-118. 被引量：9
3贺亚丽.设施果树栽培经验总结[J].西北园艺（果树）,2004(6):39-40. 被引量：1
4张朝阳,冯伍法,张俊华.基于色差的遥感影像海岸线提取[J].测绘学院学报,2005,22(4):259-262. 被引量：33
5崔建云,董晨娥,左迎之,高晓梅,徐文正.外部环境气象条件对日光温室气象条件的影响[J].气象,2006,32(3):101-106. 被引量：74
6王博,迟忠先,岳训.一种面向GIS系统的新型双层聚类方法[J].计算机工程,2006,32(7):84-85. 被引量：2
7周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：71
8袁淑荣,李天亮.气候相似理论在引种中的应用与探讨[J].种子世界,2006(7):36-38. 被引量：6
9范新南,沈红斌,陈学忠.特征空间属性加权模糊核聚类算法[J].计算机应用,2006,26(8):1888-1889. 被引量：7
10刘峻明,魏淑秋.青蒿适生地分析评价方法探讨[J].中国农业资源与区划,2006,27(4):14-17. 被引量：6

引证文献4

1贺杨成,王士同,江南,王亮.一种面向GIS系统的高维数据双层聚类方法[J].微计算机信息,2010,26(34):179-181.
2詹雅婷,朱利,孙永华,苏晓蓓,侯海倩.海岸线遥感光谱角度—距离相似度生长模型自动化提取[J].遥感学报,2017,21(3):458-469. 被引量：11
3甘诗润,魏霖静.地被植物引种气候指标相似性度量[J].软件导刊,2020,19(6):188-191. 被引量：1
4张思涵,梁宏喆,于雷.设施丑橘适宜气象条件及预报模型研究[J].中国热带农业,2023(5):54-62.

二级引证文献12

1李忠伟,王晓政,罗偲,刘旭阳,郭洪升.基于门控金字塔融合的遥感影像海陆分割方法[J].电子测量技术,2023,46(15):111-117.
2阚丽萍,邹亚荣,胡卓玮.多光谱与纹理特征结合的WorldView-2影像海岸线提取方法研究——以马来西亚棉花岛为例[J].海洋学研究,2018,36(4):43-52. 被引量：2
3吴一全,刘忠林.遥感影像的海岸线自动提取方法研究进展[J].遥感学报,2019,23(4):582-602. 被引量：56
4唐硕,张云,魏东岚,苑睿洋.辽宁省海岸线稳定性时空演变规律研究[J].资源开发与市场,2019,35(12):1472-1475. 被引量：2
5曹媛媛,李阳,文言,崔云健,赵亮.基于SAR影像的连云港海岸线提取[J].科技视界,2019,0(31):96-97.
6栾奎峰,刘帅,潘与佳,朱卫东,李丕学,裘诚,邱振戈,沈蔚,王洁,王振华.基于改进标记分水岭的高分辨率遥感影像海岸水边线提取方法[J].海洋学研究,2021,39(1):20-28. 被引量：4
7尹航,戚洪帅,蔡锋,张弛,刘根,赵绍华,宋嘉诚,赵国润.高分影像砂质海岸线精细提取及校正方法[J].海洋学报,2022,44(4):143-152. 被引量：3
8苏倩欣,李高聪,李志强,胡鹏鹏.基于遥感数据的水边线提取方法比较——以海南岛为例[J].海洋技术学报,2022,41(2):20-27. 被引量：3
9卢鹏,张娜,邹国良,王振华,郑宗生.基于双重注意力机制的CycleGAN海岸线自动提取方法[J].激光与光电子学进展,2022,59(12):82-92.
10高慧,阎晓东,张衡,牛艺婷,王家琪.基于Res2Net的多尺度遥感影像海陆分割方法[J].光学学报,2022,42(18):147-154. 被引量：8

1冯永,吴开贵,熊忠阳,吴中福.一种有效的并行高维聚类算法[J].计算机科学,2005,32(3):216-218. 被引量：6
2陈云开,卢正鼎,刘芳,郭洁.一种高维聚类算法及在洗钱侦测中的应用[J].计算机科学,2007,34(6):191-193. 被引量：5
3刘勘,周晓峥,周洞汝.一种基于排序子空间的高维聚类算法及其可视化研究[J].计算机研究与发展,2003,40(10):1509-1513. 被引量：3
4冯永,钟将,熊忠阳,叶春晓,吴中福.一种自底向上的高维聚类算法[J].重庆大学学报（自然科学版）,2006,29(9):106-110.
5宗瑜,李明楚,徐贯东,张彦春.局部显著单元高维聚类算法[J].电子与信息学报,2010,32(11):2707-2712. 被引量：1
6郏宣耀.基于相似性二次度量的高维数据聚类算法[J].计算机应用,2005,25(B12):176-177. 被引量：3
7顾冬娟,戴浩.改进的基于密度和网格的高维聚类算法[J].科技创新导报,2008,5(22):29-29.
8朱倩,黄志军.一种改进的基于密度和网格的高维聚类算法[J].舰船电子工程,2005,25(5):55-56. 被引量：5
9吴涛,陈黎飞,郭躬德.优化子空间的高维聚类算法[J].计算机应用,2014,34(8):2279-2284. 被引量：27
10吴红艳,王蔚韬,文俊浩,何光辉.具有输入知识的高维数据聚类算法研究[J].计算机科学,2006,33(1):240-242. 被引量：1

微计算机信息

2009年第27期

浏览历史

内容加载中请稍等...

基于相似性度量的高维聚类算法的研究被引量：4

参考文献6

二级参考文献15

共引文献113

同被引文献54

引证文献4

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于相似性度量的高维聚类算法的研究 被引量：4

参考文献6

二级参考文献15

共引文献113

同被引文献54

引证文献4

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于相似性度量的高维聚类算法的研究被引量：4