摘要
随着Web数据库的广泛应用,Web正在不断"深化"。传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源。为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成。其中,数据源发现是整合Deep Web资源的首要工作,能否高效地发现Deep Web站点是Deep Web数据获取的关键。提出了一种基于传统搜索引擎的Deep Web数据源发现方法,该方法通过分析返回结果来扩展查询,从而进一步提高了数据源发现的效率。实验证明该方法能得到较好的结果。
With the prevalence of Web database,Web is continuously deepened. Traditional search engines are only able to reach surface Web except for deep Web source. To make use of deep Web source efficiently,must perform scalable integration on deep Web data. In this case, data source discovery is a chief task. It's crucial to obtain deep Web data that whether or not locates the deep Web efficiently. Describes a deep Web source discovery method based on traditional .search engine. It further improves the efficiency of data source discovery by query expansion via result analysis. The test gets good result.
出处
《计算机技术与发展》
2008年第8期58-60,64,共4页
Computer Technology and Development
基金
国家自然科学基金项目(60673092)
2005年度教育部科研重点项目(205059)
教育部"高校博士学科点科研基金项目"(20040285016)
江苏省高技术研究计划项目(BG2005019)