-
题名基于信息熵的离散化算法的研究与实现
- 1
-
-
作者
刘城霞
朱敏玲
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学计算机学院单位
北京信息科技大学计算机学院单位
-
出处
《软件工程与应用》
2019年第6期358-363,共6页
-
基金
本项目得到网络文化与数字传播北京市重点实验室开放课题资助
促进高校内涵发展–科研水平提高项目(5221823410)资助。
-
文摘
离散化算法将连续属性的取值范围划分为很多个小的区间,每个区间都对应着自己的离散化符号,合理的离散化能够更准确的表达信息。本课题研究并实现了一种基于信息熵的离散化算法,通过赋予断点信息熵来度量断点的重要性从而对集合S进行划分。首先计算连续的属性的候选断点属性集,其次从候选断点集合中选取一个使信息熵最小的断点加入到断点集合中,该断点把集合S分成了两个部分,之后对于每一个子集合确定断点直到对于集合S的划分足够表达不同信息,满足最小区分长度准则完成。本文最后用实验验证了此算法的正确性和有效性,并对多组数据进行了测试和比较。
-
关键词
信息熵
离散化
断点
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名启发式值约简算法的研究与实现
- 2
-
-
作者
刘城霞
张李梅
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学计算机学院单位
-
出处
《数据挖掘》
2018年第1期23-35,共13页
-
基金
2017到网络文化与数字传播北京市重点实验室开放课题资助,课程建设“实培计划毕设(论文)项目”资助。
-
文摘
在粗糙集理论的基础上,本文研究了启发式值约简的过程。本文研究的就是在属性约简完成后的启发式值约简算法,它一般先构造由约简属性集合和决策属性组成的决策表;然后利用一定的启发式信息对其进行去重操作,得到的新表将作为值约简的初始决策表;最后,判断记录中的各个属性值是否冗余,删除冗余属性值,对记录的属性值进行约简得到近似最小规则集。最终实现了其测试系统。
-
关键词
启发式值约简
最小规则集
粗糙集
-
Keywords
Heuristic Value Reduction
Approximate Minimum Rule Set
Rough Set
-
分类号
TP1
[自动化与计算机技术—控制理论与控制工程]
-