期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于文本集密度的特征选择与权重计算方案 被引量:8
1
作者 吴科 石冰 +1 位作者 卢军 牛小飞 《中文信息学报》 CSCD 北大核心 2004年第1期42-47,共6页
在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方... 在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方法。它是一种使用词对文本集密度的贡献衡量该词的价值的方法。使用这种方法 ,我们能找出不损失文本有效信息的最小特征词语集 ,并且创造出更为合理权重计算方案。在文中还用了一种新的衡量权重好坏的标准———元打分法 。 展开更多
关键词 计算机应用 中文信息处理 信息检索 文本集密度 权重计算方案 元打分法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部