摘要
为解决不同的计算机平台、数据存储格式、文档模型以及结构文档模式的异构性,以及联邦数字图书馆和信息检索等应用环境中将一种模式下的数据结构转换成另一种模式下数据结构的需求。提出一个基于概率的模式匹配映射框架,称作PMap,使用概率论的方法,给出候选预测权值的概率学解释,从而选择一个最优的匹配方式。模式匹配就是寻找异构模式之间一致性,将主要应用在数据交换和联邦数字图书馆中的分布式信息检索领域中,使得异构文档获得统一的检索格式。
Distributed information systems tend to be highly heterogeneous, integrate different computer platforms, data storage formats, document models and schemas which structure the documents and the latter aspectrequires to transform data structured under one schema into data structured under a different schema. For these reason, a probabilistic framework is introduced, called PMap. Our approach gives a probabilistic interpretation of the prediction weights of the candidates, selects the rule set with highest matching probability. Schema matching is the problem of finding correspondences (mapping rules, e.g. logical formulae) between heterogeneous schemas e.g. in the data exchange domain, or for distributed IR in federated digital libraries. The union formulae is formed by IR heterogeneous.
出处
《计算机工程与设计》
CSCD
北大核心
2008年第17期4626-4628,共3页
Computer Engineering and Design
基金
秦皇岛市2006年科学技术研究与发展指导计划基金项目(20060286)
中国环境管理干部学院院内科研基金项目(S2006020)
燕山大学科技发展基金项目(YDJJ200591)
关键词
模式匹配
概率论
PMap
数据交换
概率论
schema matching
probability theory
PMap
data exchange
probability theory