摘要
通过对查询短语的结构分析,认为查询短语通常由关键字和特征词构成。特征词是对网页内容的概括,它预示着网页中包含一组特定的特征词条。基于此思想建立了面向Web网页内容的特征库,研究了以Web网页内容特征库为基础实现对查询短语进行语义理解的方法,提出了相关度级别的算法,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该方法基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。
出处
《情报杂志》
CSSCI
北大核心
2005年第6期58-59,63,共3页
Journal of Intelligence