期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的TF-IDF中文本特征词加权算法研究 被引量:10
1
作者 申剑博 《软件导刊》 2015年第4期67-69,共3页
在自动文本分类中,TF-IDF算法是最为常用的特征权重计算方法。该算法运用广泛,但是存在不足:只考虑了特征词的频率和包含特征词的文档数量,没有考虑到特征词在类内和类间对权重的影响。对特征词权重计算方法进行了改进。为了解决特征词... 在自动文本分类中,TF-IDF算法是最为常用的特征权重计算方法。该算法运用广泛,但是存在不足:只考虑了特征词的频率和包含特征词的文档数量,没有考虑到特征词在类内和类间对权重的影响。对特征词权重计算方法进行了改进。为了解决特征词在类内均匀分布以及在类间的比重问题,提出了修正函数TF-DFI-DFO。实验比较发现,新的特征词权重算法能够更加精确地反映出特征词的分布情况,该算法与传统的TF-IDF算法相比,在召回率、查准率和宏平均值上都有较大的提升。 展开更多
关键词 文本分类 TF-IDF算法 特征词权重 特征词分布 宏平均值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部