-
题名基于信息熵的特征子集选择启发式算法的研究
被引量:8
- 1
-
-
作者
钱国良
舒文豪
陈彬
权光日
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《软件学报》
EI
CSCD
北大核心
1998年第12期911-916,共6页
-
基金
国家自然科学基金
国际合作项目彩色匹配基金
哈尔滨工业大学科技基金
-
文摘
特征子集选择问题是机器学习和模式识别中的一个重要问题.最优特征子集选择问题已被证明是NP难题.然而,目前的特征子集选择的启发式算法是基于正反例一致的,没有考虑到实际应用中的噪音数据影响,使得选择一个较好的特征子集非常困难.首先从统计学的角度分析了噪音对特征子集选择的影响,给出含有错误率的一致特征子集概念,然后利用信息熵和拉普拉斯错误估计函数构造了特征子集选择启发式算法EFS(entropybasedfeaturesubsetselection).将该算法应用于两个实际领域的学习问题,并与GFS(greedyfeaturesubsetselection)算法进行了比较.实验结果表明,EFS选择的特征子集更具有代表性。
-
关键词
特征子集选择
信息熵
启发式算法
NP问题
-
Keywords
feature subset selection, machine learning, extension matrix, entropy, noise.
-
分类号
O22
[理学—运筹学与控制论]
-
-
题名基于扩张矩阵的渐进式特征子集选择算法
被引量:3
- 2
-
-
作者
王兴起
孔繁胜
-
机构
浙江大学人工智能研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第25期108-110,178,共4页
-
文摘
特征子集选择问题一直是人工智能领域研究的重要内容,特别是近几年来,特征子集选择的算法研究已经成为机器学习和数据挖掘等领域的一个研究热点。该文在扩张矩阵的基础上提出了类扩张矩阵的概念,并将加权的期望信息和不一致错误率函数应用于特征子集的选择,实现了具有噪音处理功能的渐进式特征子集选择算法———IFSS_EM,实际领域的实验结果表明:IFSS_EM算法具有运行效率高、选择特征较具有代表性的优点,从而使其能够较好地应用于实际领域。
-
关键词
特征子集选择
扩张矩阵
噪音
渐进式学习
-
Keywords
feature subset selection,extension matrix,noise,incremental learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-