期刊文献+

基于语义分组向量空间模型的Web新闻检索算法

Web News Retrieval Algorithm Based on the Semantic Group Vector Space Model
下载PDF
导出
摘要 针对Web新闻信息结构和内容特征,在分析了传统的向量空间模型存在不足的基础上,提出了根据特征词进行语义分组的向量空间模型。该模型将一篇新闻报道中的特征词从语义上划分为相对独立的4个组:时间、地点、人物和事件,进而形成了4个向量空间,并对每个向量空间进行特征项权值和相似度的计算。理论分析和实验结果表明,改进后的模型更适应Web新闻信息的检索,使查准率、查全率和查询速度都有所提高。 Based on the structural and content feature of Web news information and the analysis of the insufficiency of the traditional vector space model,this paper proposes an improved vector space model that the semantic group is formed according to the characteristic word.This model divides the characteristic word of a report into four relatively independent groups according to the semantic meaning:time,place,character and event,and thus forms four vector spaces.Then the characteristic weight and the similarity to each vector space are calculated.Theoretical analysis and the experimental results show that the improvement of the model adapts better to Web news information retrieval,thus improving the precision,recall and computation speed.
出处 《电子科技》 2011年第4期24-26,共3页 Electronic Science and Technology
关键词 向量空间模型 语义分组 信息检索 查准率 查全率 vector space model semantic group information retrieval precision recall
  • 相关文献

参考文献5

  • 1Salton, Wong G, Yang C S. On the Specification of Term Values in Automatic Indexing [ J]. Journal of Documentation, 1973, 29(4): 351-372.
  • 2Wong S K M, Ziarko W. Generalized Vector Space Model in Information Retrieval [ C ]. Proceedings of the 8th Annual ACM SIGIR International Conference on Research and Development in Information Retrieval, 1985:18 -25.
  • 3陆玉昌,鲁明羽,李凡,周立柱.向量空间法中单词权重函数的分析和构造[J].计算机研究与发展,2002,39(10):1205-1210. 被引量:126
  • 4李晓明,阎宏飞,王继民.搜索引擎[M].北京:科学出版社,2005.
  • 5李凡,林爱武,陈国社.一种基于VSM文本分类系统的设计与实现[J].华中科技大学学报(自然科学版),2005,33(3):53-55. 被引量:19

二级参考文献4

共引文献145

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部