期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于改进信息增益特征选择的最大熵模型文本分类方法 被引量:10
1
作者 何明 《西南师范大学学报(自然科学版)》 CAS 北大核心 2019年第3期113-118,共6页
针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分... 针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分类精度,并将该改进IG特征选择算法用于最大熵模型(ME)对文本进行分类.实验结果表明:该文所提方法在进行文本分类时F1值高于传统IG算法.该文方法的ME分类精度高于K最近邻KNN(K-Nearest Neighbor)算法,说明本文方法是可行的、有效的. 展开更多
关键词 信息增益 均衡比 词频参数 最大熵模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部