期刊文献+

二进制概念聚类方法及其应用

Binary Conceptual Clustering and Its Applications
下载PDF
导出
摘要 研究了二进制概念聚类相似度定义,在正特征距离(PAD)的基础上,提出了广义正特征距离(GPAD)用于计算样本之间的相似度,并将系统聚类算法应用到实例中,所得结果与PAD距离比较,取得较好的效果。 In this paper we outline a new method for clustering based on a binary representation of datarecords. The binary database relates each entity to all possible attribute values (domain) that entity may assume. We improve PAD index with GPAD index and use hierarchical techniques in database computation to obtain a sound performance.
出处 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第5期556-558,共3页 Journal of East China University of Science and Technology
基金 上海自然科学基金资助项目(01ZD14014)
关键词 二进制概念 聚类 距离 特征区间 相似度 binary concept clustering distance attribute interval similarity
  • 相关文献

参考文献5

  • 1HanJ, Huang Y, Cercone N. Data mining: An overview from database perspective [J]. IEEE Transaction on Knowledge and Data Engineering, 1996, 8( 6):1-40.
  • 2Spiegler I, Maayan R. Storage and retrieval considerations of binary data bases[J]. Information Processing & Managemen,1985, 21(3):233-254.
  • 3Han Jiawei. Data Mining Concepts and Techniques [M].Beijing: China Machine Press, 2001.
  • 4Zippy Erlich. Data mining by means of binary representation: A model for similarity and clustering[J].Information Systems Frontiers, 2002, 4(2): 187-197.
  • 5Roy Gelbard, Spiegler Hempel. Raven paradox: A positive approach to cluster analysis [J]. Computer & Operation Research, 2000, 27:305-320.

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部