期刊文献+

信息检索的概率模式匹配

Information retrieval for probabilistic schema matching
下载PDF
导出
摘要 为解决不同的计算机平台、数据存储格式、文档模型以及结构文档模式的异构性,以及联邦数字图书馆和信息检索等应用环境中将一种模式下的数据结构转换成另一种模式下数据结构的需求。提出一个基于概率的模式匹配映射框架,称作PMap,使用概率论的方法,给出候选预测权值的概率学解释,从而选择一个最优的匹配方式。模式匹配就是寻找异构模式之间一致性,将主要应用在数据交换和联邦数字图书馆中的分布式信息检索领域中,使得异构文档获得统一的检索格式。 Distributed information systems tend to be highly heterogeneous, integrate different computer platforms, data storage formats, document models and schemas which structure the documents and the latter aspectrequires to transform data structured under one schema into data structured under a different schema. For these reason, a probabilistic framework is introduced, called PMap. Our approach gives a probabilistic interpretation of the prediction weights of the candidates, selects the rule set with highest matching probability. Schema matching is the problem of finding correspondences (mapping rules, e.g. logical formulae) between heterogeneous schemas e.g. in the data exchange domain, or for distributed IR in federated digital libraries. The union formulae is formed by IR heterogeneous.
出处 《计算机工程与设计》 CSCD 北大核心 2008年第17期4626-4628,共3页 Computer Engineering and Design
基金 秦皇岛市2006年科学技术研究与发展指导计划基金项目(20060286) 中国环境管理干部学院院内科研基金项目(S2006020) 燕山大学科技发展基金项目(YDJJ200591)
关键词 模式匹配 概率论 PMap 数据交换 概率论 schema matching probability theory PMap data exchange probability theory
  • 相关文献

参考文献8

  • 1Lenzerini M.Data integration:a theoretical perspective[C]. Proceedings of the 21st ACM SIGMOD-SIGACT-SIGART Symposiumon Principles of Database Systems,2002:233-246.
  • 2Fagin R, Kolaitis P G, Miller R, et al. Data exchange: semantics and query answering[C].Proceedings of the International Conference on Database Theory,2003:207-224.
  • 3严武军,马小燕.高校数字图书馆元数据检索系统的设计与实现[J].计算机工程与设计,2006,27(1):162-164. 被引量:15
  • 4Norbert Fuhr.Probabilistic datalog: implementing logical information retrieval for advanced applications [J]. Journal of the American Society of Information Science,2000,51 (2):95-110.
  • 5Madhavan J, Bernstein P, Chen K, et al.Corpus-based schema matching[C].Proceedings of the 21st International Conference on Data Engineering. IEEE Computer Society,2005:57-68.
  • 6Rahm E, Bemstein P A. A survey of approaches to automatic schema matching[J]. The VLDB Journal,2001,10(4):334-350.
  • 7Bilke A, Neumann F. Schema matching using duplicates [C]. Proceedings of the 21 st International Conference on Data Engineering. IEEE Computer Society,2005:69-80.
  • 8Sebastiani F. Machine learning in automated text categorization [J].ACM Computing Surveys,2002,34(1): 1-47.

二级参考文献5

共引文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部