基于特征偏好的聚类研究被引量：3

Research on Clustering with Feature Preferences

下载PDF

导出

摘要传统的聚类方法,如k均值和模糊c均值,通常并不区分数据特征对聚类的不同贡献或重要度,因此在面对高维数据聚类时,常会导致偏低的聚类性能,这归咎于聚类时未考虑高维数据特征间所存在的高度相关性或冗余。而通过在聚类时为每一特征引入权重并通过聚类目标的优化,不仅能自动获得对应的权重,而且也获得了聚类性能的提升。尽管如此,但无监督获取的特征权重未必吻合用户所期望的特征间的相对重要性(或偏好)。因此尝试利用用户给定的实际偏好设计出能反映特征偏好的聚类方法,其将现有独立于个体聚类的全局加权型偏好聚类方法拓展至聚类依赖的局部特征加权型方法,由此弥补了前者的不足,提升了偏好聚类算法的性能。 Traditional clustering methods, such as k-means and fuzzy c-means, do not generally distinguish different contributions or importance of data features to individual clusters, thus when facing high dimensional data, they often lead to lower clustering performance due to hardly considering the presence of high correlation or redundancy between features. In order to mitigate such adversity, with the introduction of the feature weights for each cluster in the clustering objective,we could automatically obtain not only the cluster-dependent weights but also the enhanced clustering performance. Though so, the feature weights obtained by an unsupervised clustering algorithm do not necessarily match the relative importance （or preferences） between the features as users expect. Thus this paper attempted to take advantage of actual preferences from users to design a clustering method which can reflect the feature preference. As a result, the proposed method not only extends the existing clustering methods with globally-weighted cluster-independent features to the one with locally-weighted cluster-dependent features but alos improves the clustering performance for feature preferences.

作者方玲陈松灿

机构地区南京航空航天大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2015年第5期57-61,共5页 Computer Science

关键词聚类分析特征偏好特征权重聚类依赖二次规划 Clustering analysis, Feature preferences, Feature weighting, Cluster-dependent, Quadratic programming

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王骏,王士同,邓赵红.特征加权距离与软子空间学习相结合的文本聚类新方法[J].计算机学报,2012,35(8):1655-1665. 被引量：22

二级参考文献3

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2王丽娟,关守义,王晓龙,王熙照.基于属性权重的Fuzzy C Mean算法[J].计算机学报,2006,29(10):1797-1803. 被引量：45
3于剑.论模糊C均值算法的模糊指标[J].计算机学报,2003,26(8):968-973. 被引量：96

共引文献21

1朱林,雷景生,毕忠勤,杨杰.一种基于数据流的软子空间聚类算法[J].软件学报,2013,24(11):2610-2627. 被引量：31
2朱林,雷景生,毕忠勤,徐菲菲.模糊加权流数据软子空间的聚类算法[J].上海电力学院学报,2013,29(6):553-557. 被引量：1
3王丽娟,郝志峰,蔡瑞初,温雯.基于实数值链接分析的ESSC融合算法[J].计算机应用研究,2014,31(5):1366-1369.
4彭波,谢丽萍.基于稀疏表示的概率子空间聚类人脸识别[J].电视技术,2014,38(11):173-176.
5王丽敏,姬强,韩旭明,黄娜.基于奇异值分解的自适应近邻传播聚类算法[J].吉林大学学报（理学版）,2014,52(4):753-757. 被引量：4
6尚福华,姜萌,马楠,解红涛.基于改进马氏聚类方法的油田分类研究[J].计算机技术与发展,2015,25(8):175-178. 被引量：1
7高明磊,张钟江,姬波.基于特征变换的DGA诊断范例推理方法[J].计算机科学,2015,42(10):251-255. 被引量：2
8刘作国,陈笑蓉.高斯加权的重构性K-NN算法研究[J].中文信息学报,2015,29(5):112-116. 被引量：1
9郭瑛洁,王士同,许小龙.基于最大间隔理论的组合距离学习算法[J].智能系统学报,2015,10(6):843-850. 被引量：2
10姬波,叶阳东,卢红星.一种基于赋权联合概率模型的聚类算法[J].数据采集与处理,2016,31(1):130-138.

同被引文献16

1江东区图书馆引进“云计算”服务[EB/OL].2015-07-23.http://www.nblib.cn/art/2015/7/23/art_1956_72201.html.
2谷琼,袁磊,熊启军,宁彬,李文新.基于非均衡数据集的代价敏感学习算法比较研究[J].微电子学与计算机,2011,28(8):146-149. 被引量：30
3李双,李文敬,孙环龙,林中明.基于多核机群的人工鱼群并行算法[J].计算机应用,2013,33(12):3380-3384. 被引量：3
4邹晴枫.区域联盟图书馆云计算服务中心的构建——以温州大学图书馆为例[J].图书馆理论与实践,2014(6):92-95. 被引量：12
5丁世飞,贾洪杰,史忠植.基于自适应Nystrm采样的大数据谱聚类算法[J].软件学报,2014,25(9):2037-2049. 被引量：26
6林楠,史苇杭.基于多层空间模糊减法聚类算法的Web数据库安全索引[J].计算机科学,2014,41(10):216-219. 被引量：18
7王中华,韩臻,刘吉强.云环境下多用户文件共享方案[J].计算机研究与发展,2014,51(12):2614-2622. 被引量：9
8陈方健,张明新,杨昆.一种具有跳跃式前进的Apriori算法[J].计算机应用与软件,2015,32(3):34-36. 被引量：10
9黎春兰.面向图书馆的云计算服务等级协议比较研究[J].现代情报,2015,35(4):75-80. 被引量：1
10于菲菲.云计算环境下的中文图书信息共享平台初探——[J].图书馆工作与研究,2015(4):67-72. 被引量：9

引证文献3

1罗绘秀.云计算环境下图书馆信息服务的变革研究[J].农业图书情报学刊,2016,28(1):184-186. 被引量：4
2杨美姣,刘惊雷.基于Nystrm方法的偏好特征提取[J].计算机应用,2018,38(9):2515-2522.
3唐新宇,张新政.基于大数据的激光光栅数据特征挖掘算法[J].激光杂志,2019,40(7):107-111. 被引量：15

二级引证文献19

1宋毓.云计算环境下图书馆移动信息服务研究[J].河北科技图苑,2016,29(6):64-66. 被引量：1
2高丁丁.云计算环境下图书馆管理的发展研究[J].河南图书馆学刊,2017,37(11):75-76. 被引量：4
3王涛.基于智库服务的图书馆信息服务平台建设研究[J].河南图书馆学刊,2017,37(11):98-100. 被引量：2
4王承涛,黄亮,谢超,徐佳,陈飞.多客户环境下IT运维资源调度模型研究[J].环境技术,2020,38(2):195-199.
5盖昊宇.基于多目标全局约束的网络通信系统跨层资源分配[J].黑龙江工业学院学报（综合版）,2020,20(3):101-105.
6郑琳,张辉.云环境下基于群智能算法的大数据聚类挖掘技术[J].现代电子技术,2020,43(15):115-118. 被引量：11
7米捷,王旭辉.基于递归熵特征提取的层次化物联网数据检测[J].河南工程学院学报（自然科学版）,2020,32(3):67-71. 被引量：1
8徐菁鸿,臧英杰.蚁群优化聚类算法在企业效率提升方面的应用研究[J].现代电子技术,2020,43(17):151-154.
9汪明珠,毛德梅.异质网络下正态云模型相似度度量方法[J].内蒙古民族大学学报（自然科学版）,2020,35(4):310-315. 被引量：1
10王国军,胡静,汪瑾.基于区块链分布优化的大数据融合QM模型研究[J].微型电脑应用,2020,36(12):113-116. 被引量：4

1Erwan Lecomte.入侵海洋[J].新发现,2012(2):112-113.
2王亚英,张春慨,邵惠鹤.变论域知识约简算法[J].上海交通大学学报,2002,36(4):566-569. 被引量：6
3小林.搞定你的IE问题[J].电脑迷,2008,0(10):14-14.
4李占利,孙卓,崔磊磊,袁鹏瑞.基于核协同表示的步态识别[J].广西大学学报（自然科学版）,2017,42(2):705-711. 被引量：1
5曹方.大数据大智慧[J].上海信息化,2013(1):18-21.
6向综.iPad充电器真能把iPhone充“爆”么[J].大众用电,2014(8):40-40.
7谢强.IPv6世界的安全问题[J].互联网天地,2005(3):14-14.
8别把设计问题归咎于扁平化用户界面[J].数码设计,2014(5):23-23.
9平板电脑杀伤力强劲全球PC出货一季度下滑3．2％[J].中国高新技术企业,2011(14):126-127.
10谷雨霖.超频与系统的稳定[J].微型计算机,1999(8):96-99.

计算机科学

2015年第5期

浏览历史

内容加载中请稍等...

基于特征偏好的聚类研究被引量：3

参考文献1

二级参考文献3

共引文献21

同被引文献16

引证文献3

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于特征偏好的聚类研究 被引量：3

参考文献1

二级参考文献3

共引文献21

同被引文献16

引证文献3

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于特征偏好的聚类研究被引量：3