-
题名基于权重查询词的XML结构查询扩展
被引量:21
- 1
-
-
作者
万常选
鲁远
-
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2008年第10期2611-2619,共9页
-
基金
国家自然科学基金
国家社会科学基金
江西省教育厅重点科技项目~~
-
文摘
文本文档信息检索中检索质量不高的一个主要原因是用户难以提出准确的描述查询意图的查询表达式.而XML文档除了具有文本文档的内容特征外,还具有结构特征,导致用户更难以提出准确的查询表达式.为了解决这一问题,提出一种基于相关反馈的查询扩展方法,可以帮助用户构建满足查询意图的"内容+结构"的查询表达式.该方法首先进行查询词扩展,找到最能代表用户查询意图的权重扩展查询词;然后在扩展查询词的基础上进行结构查询扩展;最终形成完整的"内容+结构"的查询扩展表达式.实验结果表明,与未进行查询扩展相比,扩展后prec@10和prec@20的平均准确率提高30%以上.
-
关键词
xml
信息检索
结构语义
结构查询扩展
相关反馈
-
Keywords
xml
information retrieval
structural semantics
structural query expansion
relevance feedback
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于用户相关反馈的带结构语义的XML查询词扩展
被引量:2
- 2
-
-
作者
万常选
鲁远
-
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《情报学报》
CSSCI
北大核心
2009年第3期382-388,共7页
-
基金
基金项目:国家社会科学基金(No.07BTQ025),国家自然科学基金(No.60763001),江西省自然科学基金(No.2007GZS0082),江西省教育厅科技重点项目(赣教技字[2006]320号).
-
文摘
在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式。本文在XML信息检索中提出了基于用户相关反馈的查询扩展技术,在查询扩展中除了考虑词频因素外还充分考虑了XML文档的结构特点对于扩展查询词选取的影响,包括文档中元素的语义权重、元素所在层次和词项与初始查询词间的距离因素对于扩展查询词选取的影响。实验证明本方法是可行的,且能较好地提高检索结果的准确率。
-
关键词
xml信息检索
查询扩展
相关反馈
结构语义
-
Keywords
xml information retrieval, query expansion, relevance feedback, structural semantics
-
分类号
G252
[文化科学—图书馆学]
TP311.132
[自动化与计算机技术—计算机软件与理论]
-