期刊文献+

XML文档语义检索方法研究 被引量:4

Research on XML semantic retrieval
下载PDF
导出
摘要 由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',D'í D;对q'与D'中的文档进行精确匹配得到检索结果。 With more and more application of semi-structure data, the research of XML document similarity becomes essential in the database and information retrieval communities. Given set of XML documents D and the user query q, XML retrieval is to find out the XML documents from the D which satisfies q. In order to search efficiently, a new approach is presented to calculate similarity between two XML documents. The approach is divided into three steps. The user's query q is expanded to q' by includ- ing the synonyms of q based on WordNet. q' and each XML document in D are allocated to digital signatures. After eliminating the irrelevant documents in D according to the signatures matching, a subset D' of D is got. Precise matching between q and D' is presented and final results are got.
出处 《计算机工程与应用》 CSCD 2013年第11期121-125,共5页 Computer Engineering and Applications
基金 国家自然科学基金(No.61170052) 山东省高等教育学会"十二五"高等教育科学研究课题(No.YBKT2011063) 济南科技发展计划(No.200906004)
关键词 可扩展标示语言(XML) 半结构文档 相似度 Extensive Makeup Language (XML) semi-structure data similarity
  • 相关文献

参考文献23

  • 1XPath:XML path language(XPath)2.0.[EB/OL].[2011-12-18]. http ://www.w3 .org/TR/xpath20/.
  • 2XQuery 1.0:an XML query language(Second Edition)[EB/OL]. [2011-12-18].http://www.w3.org/TR/xquery/.
  • 3孔令波,唐世渭,杨冬青,王腾蛟,高军.XML信息检索中最小子树根节点问题的分层算法[J].软件学报,2007,18(4):919-932. 被引量:23
  • 4万常选,鲁远.基于权重查询词的XML结构查询扩展[J].软件学报,2008,19(10):2611-2619. 被引量:21
  • 5刘喜平,万常选,刘德喜.有效的XML模糊内容与结构检索和计分[J].计算机研究与发展,2010,47(6):1070-1078. 被引量:5
  • 6向永清 邓志鸿 于航 等.面向XML文档的二级索引技术及其在XML关键词检索中的应用研究[J].计算机研究与发展,2009,46:373-380.
  • 7Tekli J,Chbeir R,Y6tongnon K.An overview on XML simi- larity: background, current trends and future directions[J]. Computer Science Review, 2009,3 (3) : 151-173.
  • 8Shasha D, Zhang K.Approximate tree pattern matching[M]// Pattern matching in strings, trees and arrays.IS.1.]: Oxford University Press, 1995.
  • 9Zhang K, Shasha D.Simple fast algorithms for the editing distance between trees and related problems[J].SIAM Jour- nal of Computing, 1989,18(6) : 1245-1262.
  • 10Chawathe S, Rajaraman A, Garcia-Molina H, et al.Change detection in hierarchically structured information[C]//Pro- ceedings ACM SIGMOD,Canada, 1996:26-37.

二级参考文献28

共引文献45

同被引文献41

引证文献4

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部