期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种改进的文本特征选择方法的研究与设计 被引量:1
1
作者 许高建 胡学钢 +1 位作者 路遥 涂立静 《微型电脑应用》 2008年第5期21-23,4-5,共3页
特征选择是文本挖掘技术的一个重要的环节。在中文分词的基础上,通过设计一个简单的应用程序,对文本进行预处理。然后,在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于信息增益和互信息相结合的特征选择方法。利用它... 特征选择是文本挖掘技术的一个重要的环节。在中文分词的基础上,通过设计一个简单的应用程序,对文本进行预处理。然后,在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于信息增益和互信息相结合的特征选择方法。利用它对文本文档进行特征选择,抽取代表其特征的元数据或特征词条构成特征向量,降低噪音。最后通过实验来和其它几种特征选择方法作比较,分析这种方法获取文本特征的精度。 展开更多
关键词 文本挖掘 信息增益 互信息 特征向量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部