摘要
为通过一个统一的接口访问所有分布的Web数据源,获得质量优结构好的信息,设计实现了包括Deep Web查询接口模式抽取、应用整体模式匹配算法的Deep Web查询接口模式匹配以及包含包括属性选择,表单元素生成和元素值域生成工作的查询接口集成3部分在内的基于整体模式匹配Deep Web集成系统。将该系统在Deep Web图书搜索系统中实际应用,运行结果表明,该系统设计是可行和有效的。
To get the good quality and excellent structure information through a unified interface to access all of the distribution of web data sources, the deep web integration system containing query interface schema extraction, query interface schema matching using holistic schema matching algorithm and query interface integration which including attribute selection, form elements generation and element range generation is designed, and the system is implemented in deep web book searching system. The operational result indicates that the system design is practicable and valid.
出处
《计算机工程与设计》
CSCD
北大核心
2011年第8期2679-2683,共5页
Computer Engineering and Design
基金
国家科技支撑计划基金重大项目(2007BAH10B01)
国家科技基金项目(2009GJA10034)
天津市北辰区科技创新专项基金项目(2010.1-2011.12)
关键词
DEEP
WEB
整体模式匹配
模式抽取
匹配发现
匹配构建
查询接口集成
deep web
holistic schema matching
schema extract
matching discovery
matching construct
query interface integration