-
题名不完备信息系统的容差邻域熵和属性选择
被引量:1
- 1
-
-
作者
曾凯
佘堃
-
机构
电子科技大学计算机科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第5期1120-1123,共4页
-
基金
四川省科技厅项目(2012GZ0061)资助
国家自然科学基金项目(61300192)资助
-
文摘
邻域粗糙计算模型可以处理信息系统中名义属性和字符属性共存的问题而得到了广泛应用.现有的邻域粗糙计算方法仅讨论了其处理完备信息系统问题,然而实际应用中的数据往往是不完备的.针对这一问题,首先提出了可用于度量不完备信息系统的容差邻域熵;然后得出了一系列相关定义和性质,证明了容差邻域熵是香农熵在不完备信息系统上的自然推广;最后给出了基于容差邻域熵的属性选择算法.实验结果表明,所提出的算法避免了数据过分预处理而带来的冗余信息,使样本在算法选择的特征空间内保持了较高的分类精度,可以更好地处理信息系统不完备的问题.
-
关键词
不完备信息系统
容差邻域熵
不确定性
属性选择
-
Keywords
incomplete information systems
tolerance neighborhood entropy
uncertainty
feature selection
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于邻域容差熵选择集成分类算法
被引量:1
- 2
-
-
作者
董红瑶
申成奥
李丽红
-
机构
华北理工大学理学院
河北省数据科学与应用重点实验室
唐山市工程计算重点实验室
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2023年第6期15-21,共7页
-
基金
河北省数据科学与应用重点实验室项目(10120201)
唐山市数据科学重点实验室项目(10120301)。
-
文摘
针对不完备混合型信息系统的分类问题,融合粒计算和集成学习思想,引入邻域容差关系,提出基于邻域容差熵选择集成分类算法。首先根据样本中的缺失属性将不完备混合型数据集划分为不同的信息粒,并再次遍历数据集进行最大化信息粒,构成新的粒空间,用以BP神经网络为基分类器的集成算法在粒空间上训练最大化信息粒,构建新的基分类器;然后以每个信息粒的缺失属性作为条件计算出关于类别属性的邻域容差条件熵,各个信息粒的重要度通过邻域容差条件熵进行量化后,通过信息粒的大小、新训练出的基分类器预测准确率以及邻域容差条件熵重新定义各个基分类器的权重;最后根据预测样本对基分类器加权集成,预测分类结果,并与传统的集成分类算法进行对比分析。对于不完备混合型数据集,新提出的集成分类算法能有效提升分类准确率。
-
关键词
不完备混合型信息系统
信息粒
邻域容差熵
集成学习
分类
-
Keywords
incomplete hybrid information system
information granule
neighborhood-tolerance entropy
ensemble learning
classification
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-