摘要
Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供 Web信息检索已经成为一项重要的研究课题 .Web搜索引擎部分地解决了信息检索问题 ,然而其效果却远远不能令人满意 .提出了 Web信息检索的分布协作策略以取代传统的集中式信息检索方式 ;给出了一种新的 Web信息检索系统模型 ,该模型支持对 Web文档的元数据进行检索 ,并采用 Z39.50协议作为接口标准 ,以克服不同信息检索系统之间的访问异构性 .在此基础上 ,设计了一个分布协作式 Web信息检索框架 ,用以帮助用户有效地进行 Web信息检索 .
A mass of heterogeneous, distributed and dynamic information on the Web has resulted in “information overload”. It's an important and urgent research issue to provide users with effective information retrieval service on the Web. Web search engines attempt to solve this problem, yet their effect is far from satisfying. In this paper, a distributed and cooperative strategy for Web information retrieval is proposed to substitute the centralized mode adopted by the current search engines. Then a new information retrieval system model (IRSM) is presented, which supports the retrieval of metadata about Web documents and uses Z39.50 standard protocol to unify the heterogeneous interfaces of different systems. Based on them, a distributed and cooperative information retrieval framework (DCIRF) is designed to help users search the Web effectively.
出处
《软件学报》
EI
CSCD
北大核心
2001年第4期620-627,共8页
Journal of Software
基金
国家自然科学基金资助项目!(6 0 0 730 30 )
江苏省科委"九五"科技重点攻关资助项目!(BE96 0 17)&&