期刊文献+

基于信息熵的连续属性自动聚类算法 被引量:2

Automatic Clustering Algorithm for Continuous Attributes Based on Entropy of Information
下载PDF
导出
摘要 基于信息熵的有关理论 ,提出了一种新的连续属性的自动聚类算法。首先介绍了 Shannon熵的概念及其两个重要的定理 ,基于信息的不确定测度 ,提出了一种 Shannon熵的准则函数 φ,并且指出了该准则函数必须满足的 6条原则。其次 ,基于该准则函数 ,引出了一种针对单个连续属性自动聚类的 FUSINTER算法。由于实际信息系统中有多个连续属性 ,这就需要对多个连续属性分别使用 FUSINTER算法进行离散 ,并且要求最终保证整个信息系统离散后是相容的和一致的 ,而且各个属性拥有较少的分割区间。最后 ,本文以干线飞机外形参数的变化趋势与其更新换代的关系来说明文中提出的连续属性离散化过程 ,并展示了该聚类算法的有效性。本文提出的方法可以用于机器学习或数据挖掘的数据前处理。 Based on theory of the entropy of information, a ne w method of automatic clustering algorithm is presented. Firstly, this paper int roduces the concept of Shannon entropy and its two important theorems. According to uncertainty measures of information, a criterion φ based on Shannon′s e ntropy is presented, and the criterion φ must be satisfied to six axioms. Then based on the criterion φ, FUSINTER algorithm aimed to the single con tinuous attribute, is introduced. In fact, an information system alway s has many continuous attributes, so FUSINTER algorithm will be used several times to scattering the many continuous attributes. At the same time, after aut omatic clustering, information system is compatible and coincident, and each of the attributes has fewer intervals. An example is given to prove the efficiency of the clustering algorithm.
出处 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2001年第3期233-236,共4页 Journal of Nanjing University of Aeronautics & Astronautics
关键词 连续属性 FUSINTER算法 自动聚类算法 信息熵 数据挖掘 数据库 entropy clustering continuous attributes categories attributes discretization FUSINTER algorithm
  • 相关文献

参考文献4

  • 1蒋嵘,李德毅,范建华.数值型数据的泛概念树的自动生成方法[J].计算机学报,2000,23(5):470-476. 被引量:73
  • 2Cheung D,Proceedings of the Int Symposium on Methodologies for Intelligent Systems(ISMIS'94),1994年,164页
  • 3Han J,Proceedings of the KDD'94,1994年,157页
  • 4孟庆生,信息论,1986年,18页

二级参考文献11

  • 1陈晖 李德毅.正态云模型及其在KDD中的应用[J].通信工程学院学报,1998,12(4):39-44.
  • 2Fan J,Proceedings of the 3rd Pacific-Asia Conference OnKnowledge Discovery & Data Mini,1999年,26页
  • 3范建华,博士学位论文,1999年
  • 4Li D,Knowledge Based Syst,1998年,10期,431页
  • 5Li D,Proceedings of the Second Pacific-Asia Conferenceon Knowledge Discovery &Data Mi,1998年,392页
  • 6陈晖,通信工程学院学报,1998年,12卷,4期,39页
  • 7Li D,Logic Programming and SoftComputing,1997年
  • 8Fu Y,博士学位论文,1997年
  • 9Cheung D,Proceedings of the International Symposum on Methodologies for Intelligent,1994年,164页
  • 10Han J,Proceedings of the KDD’ 94,Seattle,WA,1994年,157页

共引文献72

同被引文献5

引证文献2

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部