基于属性依赖关系和对象相关性的自然聚类算法被引量：1

Natural Clustering Algorithm Based on Attributes Dependency and Objects Correlation

下载PDF

导出

摘要针对数据集中属性间存在依赖关系以及对象间存在相关性,定义了一种新的相似关系模型,该模型所描述的相似关系能够体现对象之间的自然相关性.在此基础上提出一种基于属性依赖关系和对象相关性的自然聚类算法,该聚类算法在不事先指定聚类数目的情况下,将所有相似性达到设定阈值的对象自然聚为一类;当调整相似性阈值时,该算法还可实现不同粒度的聚类.通过分别对数值型数据集和分类型数据集进行实验比较分析,结果表明这种自然聚类算法与其他聚类算法相比,能够真实反映数据间的相关性以及数据集的自然簇结构,同时可以发现任意形状的簇,有效地提高了聚类的精度和质量. In this paper, taking into account that there exists attribute dependency and object correlation of the data sets, we proposed a novel similarity relation model in which the similarity relation is able to reflect the natural relationship between the objects. And from this we presented a natural clustering algorithm based on attributes dependency and objects correlation. It is able to group the data ob- jects into different cluster automatically under the similarity threshold without specifying the number of clusters at the beginning. Addi- tionally by adapting the similarity threshold the algorithm can group the objects into clusters on different granularity. Experimental re- suits show that comparing to other clustering algorithms it can better identify the natural cluster structure of data objects with the exper- iments on the numeric data sets and on the category data sets. Meanwhile ,it can also discover clusters of arbitrary shape. In tests of the algorithm we find that it has obvious advantages in accuracy and quality.

作者王全蕊王建平

机构地区河南科技学院信息工程学院武汉理工大学信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2015年第4期810-814,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61272109)资助

关键词属性依赖关系对象相关性相似度目标函数自然聚类 attribute dependency object correlation similarity object function natural clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1孙晓博,廖桂平.基于新的相似性度量的加权粗糙聚类算法[J].计算机工程与科学,2011,33(12):110-115. 被引量：1
2梁吉业,白亮,曹付元.基于新的距离度量的K-Modes聚类算法[J].计算机研究与发展,2010,47(10):1749-1755. 被引量：46
3周杨,苗夺谦,岳晓冬.基于自适应权重的粗糙K均值聚类算法[J].计算机科学,2011,38(6):237-241. 被引量：12

二级参考文献59

1陈宗海,文锋,聂建斌,吴晓曙.基于节点生长k-均值聚类算法的强化学习方法[J].计算机研究与发展,2006,43(4):661-666. 被引量：13
2Han Jiawei,Kamber M.Data Mining Concepts and Techniques[M].San Francisco:Morgan Kaufmann,2001.
3Brendan J F,Delbert D.Clustering by passing messages between data points[J].Science,2007,315(16):972-976.
4Zhang Jiangshe,Liang Yiuwing.Improved possibilistic c-means clustering algorithms[J].IEEE Trans on Fuzzy Systems,2004,12(2):209-217.
5Mac Q J.Some methods for classification and analysis of multivariate observation[C]//Proc of the 5th Berkley Symp on Mathematical Statistics and Probability.Berkley,California:University of California Press,1967:281-297.
6Huang Zhexue.Clustering large data sets with mixed numeric and categorical values[C]//Proc of PAKDD97.Singapore:World Scientific,1997:21-35.
7Huang Zhexue.Extensions to the K-means algorithm for clustering large data sets with categorical values[J].Data Mining and Knowledge Discovery,1998,2(3):283-304.
8Ng M K,Li Junjie,Huang Zhexue,et al.On the impact of dissimilarity measure in K-modes clustering algorithm[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2007,29(3):503-507.
9San O M,Huynh V N,Nakamori Y.An alternative extension of the K-means algorithm for clustering categorical data[J].Int Journal Application Mathematic and Computer Science,2004,14(2):241-247.
10Li Cen,Biswas G.Unsupervised learning with mixed numeric and nominal data[J].IEEE Trans on Knowledge and Data Engineering,2002,14(4):673-690.

共引文献56

1陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
2赵根柱,巴特尔,王钢.基于均值汇总模型的网络流量评估方法的研究[J].广西大学学报（自然科学版）,2011,36(A01):27-30.
3任丽娜,秦永彬,许道云.基于自适应权重的模糊C-均值聚类算法[J].计算机应用研究,2012,29(8):2849-2851. 被引量：8
4于海涛,李梓,姚念民.K-means聚类算法优化方法的研究[J].小型微型计算机系统,2012,33(10):2273-2277. 被引量：22
5杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：21
6于海涛,王慧强,李梓,韩立娟.基于模拟谐振子的优化K-means聚类算法[J].计算机工程与应用,2012,48(30):122-127. 被引量：4
7王熙照,王婷婷,翟俊海.基于样例选取的属性约简算法[J].计算机研究与发展,2012,49(11):2305-2310. 被引量：28
8杨阳,张为群,刘枫,黄仁杰.基于MapReduce自适应参数的粗糙K-modes算法研究[J].计算机科学,2012,39(11):149-152.
9李梓,蒋庆丰,程晓旭,贾美娟.一种基于信任值的分类属性聚类算法[J].微型机与应用,2012,31(22):57-59.
10于海涛,贾美娟,王慧强,邵国强.基于人工鱼群的优化K-means聚类算法[J].计算机科学,2012,39(12):60-64. 被引量：23

同被引文献13

1程瑶,应凌云,焦四辈,苏璞睿,冯登国.移动社交应用的用户隐私泄漏问题研究[J].计算机学报,2014,37(1):87-100. 被引量：44
2王娜,许大辰.移动社交网络中个人信息保护现状的调查与分析——从用户行为习惯视角出发[J].情报杂志,2015,34(1):185-189. 被引量：36
3常文英,刘冰.基于可信度分析的微博用户个人信息泄露实证研究——以新浪微博为例[J].情报杂志,2015,34(8):169-176. 被引量：14
4迪莉娅.大数据环境下隐私泄露影响评估研究[J].情报杂志,2016,35(4):141-146. 被引量：25
5罗力.我国移动互联网用户个人信息安全风险和治理研究[J].图书馆学研究,2016(13):37-41. 被引量：26
6李睿,张锐剑,李文立,陈昊.移动互联网环境下的隐私泄露容忍度测度方法[J].管理评论,2016,28(7):102-111. 被引量：22
7朱光,丰米宁,陈叶,杨嘉韵.大数据环境下社交网络隐私风险的模糊评估研究[J].情报科学,2016,34(9):94-98. 被引量：27
8郑倩月,刘梁文,王毅.大数据时代背景下大学生个人隐私保护探究[J].科技创新导报,2016,13(22):103-105. 被引量：4
9陆雪梅,古春生.大数据环境下用户信息隐私泄露成因分析和保护对策[J].现代情报,2016,36(11):66-70. 被引量：29
10白伟,李中原,贺小红.大学生移动社交网络个人隐私保护研究[J].价值工程,2018,37(27):215-216. 被引量：4

引证文献1

1王全蕊,张浩飞,袁梦宇.大数据背景下移动社交网络中大学生用户信息泄露的研究分析[J].现代计算机,2020,26(26):21-26. 被引量：4

二级引证文献4

1冯英华,于倩倩.社交媒体学术交流风险认知调查分析[J].数字图书馆论坛,2020(12):58-64. 被引量：1
2张浩飞,袁梦宇,胡振坤,张鑫钰,王全蕊.移动社交网络中大学生用户隐私泄露防范措施探究[J].数码设计,2021,10(9):179-180.
3张浩飞,袁梦宇,胡振坤.移动社交网络中大学生用户行为特征分析与实证研究[J].科技创新导报,2021,18(14):140-145. 被引量：1
4周爱平.移动互联网时代高校网络安全问题探讨[J].网络安全技术与应用,2022(5):92-93.

1李明,李东阳,汪海军,郑波.信息系统中属性依赖关系的算法研究[J].计算机时代,2003(12):3-4.
2韩培安,王力生.单线程程序到多线程程序的自动转换[J].微计算机应用,2010,31(12):28-33.
3李玉霞.静电场中的几种图象[J].高中数理化（高二版）,2008(7):40-40.
4宗平,秦军.存在依赖关系在面向对象建模中的研究[J].计算机工程与应用,2001,37(21):63-65.
5擂台赛点评[J].电脑爱好者,1999,0(9):89-90.
6孙江文,王崇骏,王珺,陈世福.L^2DLNB:懒惰学习双层朴素贝叶斯分类器[J].计算机科学,2007,34(1):136-139. 被引量：1
7周兵,李家国,吴贯锋,刘扬.面向遥感产品生产的可视化数据流模型[J].河南大学学报（自然科学版）,2013,43(1):74-78. 被引量：9
8黄晨量,高建华.基于场景驱动方法的跟踪依赖关系的研究[J].计算机工程,2005,31(19):102-104. 被引量：1
9薛金蓉,安秋生,郑军.概念格的内涵缩减与数据库推理依赖[J].计算机研究与发展,2014,51(1):96-103. 被引量：6
10李聪,梁昌勇,杨善林.基于粗糙集的不完备信息系统空值估算方法[J].计算机集成制造系统,2009,15(3):604-608. 被引量：9

小型微型计算机系统

2015年第4期

浏览历史

内容加载中请稍等...

基于属性依赖关系和对象相关性的自然聚类算法被引量：1

参考文献3

二级参考文献59

共引文献56

同被引文献13

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于属性依赖关系和对象相关性的自然聚类算法 被引量：1

参考文献3

二级参考文献59

共引文献56

同被引文献13

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于属性依赖关系和对象相关性的自然聚类算法被引量：1