摘要
讨论了如何精确计算结构化文档相关度的理论模型和算法.首先分析了基于语义内容的文档相关度和基于文档特征的文档相似度之间的区别,提出利用树同构思想测量文档语义相关性.在计算过程中,通过为结点赋予不同权重反映匹配结点的位置重要性,对于未匹配结点则首次提出利用影响因子针对不同情况做适当区分,最后给出文档相关度计算公式.实验证明,此方法能够很好地区分信息检索中的模糊或者相近的请求及文档.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期350-355,共6页
Journal of Computer Research and Development
基金
山东省自然科学基金重大项目(Z99G01)
国家"八六三"高技术研究发展计划基金项目(863-306-ZT06-01-4)