摘要
研究了二进制概念聚类相似度定义,在正特征距离(PAD)的基础上,提出了广义正特征距离(GPAD)用于计算样本之间的相似度,并将系统聚类算法应用到实例中,所得结果与PAD距离比较,取得较好的效果。
In this paper we outline a new method for clustering based on a binary representation of datarecords. The binary database relates each entity to all possible attribute values (domain) that entity may assume. We improve PAD index with GPAD index and use hierarchical techniques in database computation to obtain a sound performance.
出处
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2004年第5期556-558,共3页
Journal of East China University of Science and Technology
基金
上海自然科学基金资助项目(01ZD14014)
关键词
二进制概念
聚类
距离
特征区间
相似度
binary concept
clustering
distance
attribute interval
similarity