独立于应用的数据库聚类技术被引量：1

Application-independent databases clustering technology

下载PDF

导出

摘要文章提出了一种独立于应用的数据库聚类技术,是多数据库挖掘的重要步骤,处于数据准备阶段,也是分组规则合成的前提,该技术主要包括多数据库最优划分方法,该方法将数据库的属性集当作其特征。数据库最优划分方法采用非对称二元变量相似度计算方法得到数据库间相似度,利用分裂层次聚类法对数据库进行完全划分,然后借鉴k中心点方法提出最大树方法选出对应簇中心,最后利用自适应模糊C-均值聚类方法的评价函数获得最优划分。 A kind of application-independent databases clustering technology is presented, which is an important step of the multi-database mining process in the data preparation phase, and is the require- ment of the group-rule synthesis. The technology mainly includes a best partitioning approach of databases which takes the attributes of a database as its characteristic. Through the best partitioning approach of databases, the asymmetric binary variable similarity computing method is applied to obtaining the similarity between two databases, and the divisive hierarchical clustering method is utilized to completely divide all given databases. Then the maximum-tree method derived from k-medoids is used to select the corresponding centers, and the score function of adaptive fuzzy C-means clustering （AFCMC） is used to find the best partition.

作者程文琛胡学钢

机构地区合肥工业大学计算机与信息学院

出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2013年第7期802-806,共5页 Journal of Hefei University of Technology：Natural Science

基金国家自然科学基金资助项目(60975034)

关键词非对称二元变量分裂层次聚类 k中心点法自适应模糊C-均值聚类算法最优划分 asymmetric binary variable divisive hierarchical clustering k-medoids adaptive fuzzy C- means clustering（AFCMC） best partition

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1Zhang Shichao,Zhang Chengqi, Wu Xindong. Knowledgediscovery in multiple databases [ M ]. Springer, 2004:79-135.
2Liu H,Lu H, Yao J. Identifying relevent databases formulti-databases mining[C]//Proceedings of the Second Pa-cific-Asia Conference on Knowledge Discovery and Datamining, April 15-18,1998:210-221.
3Cheung D,Ng V, Fu A, et al. Efficient mining of associa-tion rules in distributed databases[J]. IEEE Transactionson Knowledge and Data Engineering, 1996,8(6):911-922.
4Wu Xindong,Zhang Chengqi,Zhang Shichao. Database clas-sification for multi-database mining [J]. Information Sys-tem. 2005,30:71 - 88.
5曹慧.一种基于聚类的多数据库分类方法设计[J].网络安全技术与应用,2010(6):79-81. 被引量：1
6Zhang S, Zhang C. Estimating itemsets of interest by sam-pling [C]//Proceedings of the 10th IEEE InternationalConference on Fuzzy Systems, 2001:131 -134.
7Han Jiawei,Kamber M.数据挖掘概念与技术[M].第2版.范明,孟小峰,译.北京:机械工业出版社,2007: 255 -256.
8陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,2008,19(1):62-72. 被引量：82
9刘金岭.k中心点聚类算法在层次数据的应用[J].计算机工程与设计,2008,29(24):6418-6419. 被引量：8
10李为民,朱永锋,付强.基于自适应模糊聚类分析的目标冗余信息处理[J].计算机应用,2005,25(4):949-951. 被引量：5

二级参考文献41

1哈斯巴干,马建文,李启青,刘志丽,韩秀珍.模糊c-均值算法改进及其对卫星遥感数据聚类的对比[J].计算机工程,2004,30(11):14-15. 被引量：12
2洪志令 ,姜青山 ,董槐林 ,Wang Sheng-Rui .模糊聚类中判别聚类有效性的新指标[J].计算机科学,2004,31(10):121-125. 被引量：15
3诸克军,苏顺华,黎金玲.模糊C-均值中的最优聚类与最佳聚类数[J].系统工程理论与实践,2005,25(3):52-61. 被引量：69
4陈志坚.雷达数据处理中非真实目标点迹的处理[J].现代雷达,1995,17(3):43-48. 被引量：12
5刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
6刘小芳.点密度加权FCM算法的聚类有效性研究[J].计算机工程与应用,2006,42(15):20-22. 被引量：8
7匡平,朱清新,陈旭东.基于FCM的快速模糊聚类算法研究[J].电子测量与仪器学报,2007,21(2):15-20. 被引量：9
8Jain AK, Duin Robert PW, Mao JC.Statistical pattern recognition: A review[J].IEEE Trans Actions on Pattern Analysis and Machine Intelligence,2000,22( 1):4-37.
9Sambasivam S, Theodosopoulos N. Advanced data clustering methods of mining web documents[R].Issues in Informing Science and Information Technology,2006.
10Gelbard R,Goldman O,Spiegler I.Investigating diversity of clustering methods: An empirical comparison [J]. Data and Knowledge Engineering,2007,63 ( 1 ): 155 - 166.

共引文献258

1袁小翠,刘宝玲,马永力.基于空间邻域连通区域标记法的点云离群点检测[J].计算机应用研究,2020,37(S02):380-382. 被引量：6
2肖微炜,钱瑜,赵胜豪,王亚伟.基于模糊聚类的生态功能区若干指标定量划分的研究[J].四川环境,2008,27(3):57-60. 被引量：1
3吴成茂,范九伦.一种新的数据分类效果评价方法[J].计算机工程与应用,2004,40(25):171-172.
4郭中敏,徐康,岳颖,黄冰,唐欢,马芸,洪迅,陈系古,肖东.细胞可透过性Cre重组酶表达、纯化及生物活性检测(英文)[J].生物化学与生物物理进展,2004,31(9):784-790. 被引量：1
5汪加才,朱艺华.模糊K-Prototypes算法中的加权指数研究[J].计算机应用,2005,25(2):348-351. 被引量：4
6罗明,杨绍全.一种多进制频移键控信号的调制分类及解调方法[J].西安电子科技大学学报,2005,32(1):52-55. 被引量：10
7宫改云,高新波,伍忠东.FCM聚类算法中模糊加权指数m的优选方法[J].模糊系统与数学,2005,19(1):143-148. 被引量：81
8姜园,张朝阳,仇佩亮,周东方.用于数据挖掘的聚类算法[J].电子与信息学报,2005,27(4):655-662. 被引量：68
9罗明,杨绍全.基于动态聚类的MPSK信号调制分类[J].电路与系统学报,2005,10(2):83-86. 被引量：2
10唐宁玉.瑞典商业银行的教堂塔原则[J].人才资源开发,2005(5):61-61.

同被引文献8

1单凯晶,肖怀铁,朱俊.基于模糊核C-均值聚类分析的HRRP识别[J].电光与控制,2010,17(5):42-45. 被引量：3
2张水波.一种基于半监督模糊聚类的人脸识别方法[J].闽西职业技术学院学报,2012,14(4):117-120. 被引量：1
3王立君.并行多媒体数据库中基于内容的高效检索的数据分配方法的研究[J].科学技术与工程,2013,21(9):2544-2548. 被引量：5
4郭鑫,颜一鸣,徐洪智,董坚峰.不确定树数据库中的动态聚类算法[J].小型微型计算机系统,2013,34(6):1339-1343. 被引量：4
5王雪,周烜,王珊.混合的大规模数据库自动模式抽象方法[J].计算机学报,2013,36(8):1616-1625. 被引量：4
6吕俊亚.混合数据库中的脏数据隔离优化技术仿真[J].计算机仿真,2014,31(4):252-254. 被引量：6
7张晶,张阳.在数据流数据库中集成聚类算法研究与实现[J].计算机应用研究,2014,31(5):1456-1458. 被引量：1
8杨华勇,林晓丽,林立宇.基于格拉斯曼流形上谱聚类的视频人脸识别[J].计算机应用与软件,2014,31(5):168-171. 被引量：4

引证文献1

1郭晋秦,韩焱.大型数据库聚类中伪装危险数据识别方法研究[J].计算机仿真,2015,32(11):433-436. 被引量：4

二级引证文献4

1史斌.大型数据库分区表研究[J].中国新通信,2016,0(11):116-117. 被引量：1
2明章强,李文华.实验室信息管理系统数据库优化方法研究[J].电脑编程技巧与维护,2017(14):58-60.
3史斌.大型数据库Oracle脱机备份研究与应用[J].中国新通信,2016,18(19):107-108.
4刘久彪.空间数据库反向最近邻聚类方法[J].吉林大学学报（理学版）,2019,57(2):387-392. 被引量：40

1张应辉,饶云波.最小差异度聚类在异常入侵检测中的应用[J].计算机应用研究,2007,24(12):193-195. 被引量：1
2孙金玮,王庆龙,周庆东.基于遗传算法的多功能传感器模型参数估计[J].哈尔滨工业大学学报,2004,36(3):286-289.
3刘敏娴.类算法在保险行业的运用与分析[J].电脑知识与技术,2009,0(4Z):2795-2796.
4张国云,章兢.一种新的分裂层次聚类SVM多值分类器[J].控制与决策,2005,20(8):931-934. 被引量：9
5周子明,许宏年.多数据库挖掘技术的研究[J].知识经济,2015,0(3):76-76.
6吕刚.基于聚类的多数据库分类算法的研究与实现[J].电脑知识与技术,2008(10):7-7.
7乡碧云,朱敏.板料机床二元变量数字控制系统的研究[J].制造技术与机床,2009(5):89-91. 被引量：1
8郝艳友,迟忠先,闫德勤,张永.一种结合Vague集的模糊支持向量机研究[J].小型微型计算机系统,2009,30(5):928-932.
9张传升,萧蕴诗,赵勇.用模糊C-均值聚类方法挖掘Web日志潜在客户的应用研究[J].微型机与应用,2005,24(1):57-60.
10许伟,段富.聚类与协同过滤相结合的隐式推荐系统[J].计算机工程与设计,2014,35(12):4181-4185. 被引量：4

合肥工业大学学报（自然科学版）

2013年第7期

浏览历史

内容加载中请稍等...

独立于应用的数据库聚类技术被引量：1

参考文献12

二级参考文献41

共引文献258

同被引文献8

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

独立于应用的数据库聚类技术 被引量：1

参考文献12

二级参考文献41

共引文献258

同被引文献8

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

独立于应用的数据库聚类技术被引量：1