期刊文献+

一种节点加权的相似重复XML数据检测算法 被引量:3

下载PDF
导出
摘要 XML类型的数据成为当前主流的数据形式,本文提出一种检测XML数据相似性的方法,即将XML文档转换成树结构的基础上,对树结构的节点加权,并结合树编辑距离算法。通过XML带权树各属性权值计算的相似度对数据进行粗略匹配与聚集,而在重新聚集的集合中使用树编辑距离算法更直接的进行相似性检测。由于XML数据集合范围的缩小,树编辑距离算法操作的次数减少,从而节省了一定的时间。
作者 孙娜 吴兰兰
出处 《计算机光盘软件与应用》 2014年第2期99-100,共2页 Computer CD Software and Application
  • 相关文献

参考文献7

  • 1韩恺,岳丽华,龚育昌.基于上下文的异构文档类型定义匹配[J].小型微型计算机系统,2005,26(2):256-260. 被引量:8
  • 2Flesca S,Manco G,Masciari E. Detecting structural similarities between XML documents[A].2002.55-60.
  • 3Tai K C. The tree-to-tree correction problem[J].{H}Journal of the ACM,1979,(03):422-433.
  • 4David T.Barnard,Gwen Clarke. Tree-to-tree Correction for Document Trees[Z].1995.
  • 5Zhang K. Shasha D[J].SIMPLE FAST ALGORITHMS FOR THE EDITING DISTANCE BETWEEN TREES AND RELATED PROBLEMS,1989,(06):1245-1262.
  • 6Zhang K. Algorithms for the constrained editing distance between ordered labeled trees and related problems[J].1995,(03):463-474.
  • 7江曼;陈继明;潘金贵.基于XML的层次式过滤研究[A],2006.

二级参考文献16

  • 1Miller A G. WordNet. A lexical database for english[J]. Comm. ACM, 1995,38(11):39-41.
  • 2http://anhai.cs.uiuc.edu/archive/
  • 3Li Xu, David W. Embley. discovering direct and indirect matches for schema elements[C]. DASFAA03.
  • 4Arnaud Sahuguet: Everything You Ever Wanted to Know About DTDs, But were afraid to ask[C]. WebDB 2000.
  • 5Garcia-Solaco M, Saltor F, Castellanos M. A structure based schema integration methodology[C]. ICDE 1995.
  • 6Kashyap V, Sheth A P. Semantic and schematic similarities between database objects: a context-based approach[J]. VLDB Journal, 176-304.
  • 7Milo T,Zohar S. Using schema matching to simplify heterogeneous data translation[C]. VLDB 1998.
  • 8Madhavan J, Bernstein P A, Rahm E. Generic schema matching with cupid[Z]. VLDB, 2001
  • 9http://www.biztalk.org
  • 10http://www.xml.org

共引文献7

同被引文献27

引证文献3

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部