期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
文本分类中特征权重因子的作用研究 被引量:16
1
作者 张爱华 靖红芳 +1 位作者 王斌 徐燕 《中文信息学报》 CSCD 北大核心 2010年第3期97-104,共8页
在传统的基于向量空间的文本分类中,特征权重计算与特征选择过程完全割裂,特征选择函数的得分能反映特征的重要性,却未被纳入权重表示,造成特征表示不精确并影响分类性能。一些改进方法使用特征选择函数等修改TFIDF模型,提高了分类性能... 在传统的基于向量空间的文本分类中,特征权重计算与特征选择过程完全割裂,特征选择函数的得分能反映特征的重要性,却未被纳入权重表示,造成特征表示不精确并影响分类性能。一些改进方法使用特征选择函数等修改TFIDF模型,提高了分类性能,但没有探究各权重因子如何影响分类的性能。该文以词频、逆文档频率及特征选择函数分别作为衡量特征的文档代表性、文档区分性及类别区分性的因子,通过实验测试了它们对分类性能的影响,得到文档代表性因子能使分类效果峰值最高但抵抗噪音特征能力差、文档区分性因子具有抗噪能力但性能不稳定、而类别区分性因子抗噪能力最强且性能最稳定的结论。最后给出权重表示的四点构造原则,并通过实验验证了其对分类性能的优化效果。 展开更多
关键词 计算机应用 中文信息处理 文本分类 权重表示 权重因子作用 VSM
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部