期刊文献+

基于兴趣模型的WEB信息预测采集过滤方法 被引量:3

Forecast and Filter Method for Web Page Gathering Based on Interested Model
下载PDF
导出
摘要 Web网上海量信息急速膨胀使得有效定向采集相关信息检索成为网上信息查询一个日益重要的研究方向。该文提出一种基于用户兴趣模型的Web文本信息预测采集过滤方法。这种方法根据正反集文本过滤方法,设计出一种用户兴趣模型,并在对Web站点结构进行分析的基础上,通过对网页的相关度的预测来控制信息的采集。在保持定向采集精度的同时,缩短采集时间、减少存储、加快检索,节约了网络资源。 Following rapid expansion of huge information on Web,the efficient Web information gathering on specified fields becomes more important in information retrieval research.Based on the interested model of user,this paper presents the Forecast and Filter Method for Web page Gathering.The method applies text filter with plus and minus sets provided by user to design the interested model.Forecast for the relativity of Web page controlled the gathering,based on the analysis of Website structure.Gathering time shortened,storage decreased,retrieval speeded,net resources saved.
出处 《计算机工程与应用》 CSCD 北大核心 2003年第5期3-5,16,共4页 Computer Engineering and Applications
基金 1999~2000年度国家技术创新项目″中国技术创新网″建设 2002年的″中国技术创新网″升级改造项目 国家经贸委国家重点技术创新项目"中国技术创新信息网系统开发"中信息采集检索部分
关键词 兴趣模型 信息预测采集过滤方法 信息采集 文本过滤 WEB 网络资源 网页 INTERNET 信息检索 Information Gathering,Interested Model,Text Filtering
  • 相关文献

参考文献6

二级参考文献27

  • 1李水平,小型微型计算机系统,1998年,19卷,4期,74页
  • 2Salton G,Commun ACM,1975年,18卷,11期,613页
  • 3王珊,数据仓库技术与联机分析处理,1998年
  • 4Eichstaedt M,6th International Workshop on Solving Irregularly Structured Problems in Paralle,1998年,17页
  • 5程学旗,中文信息处理国际会议论文集,1998年,418页
  • 6Lu Qi,Computer Networks ISDN Systems,1997年,30卷,7期,443页
  • 7姚天顺,自然语言理解,1995年
  • 8Yan T W,Proc of 3 rd International Conference on Parallel andDistributed Information Sys,1994年,89页
  • 9Yan T W,Proc of 1995 U SENIX Technical Conf.Http://www-db.standford.edu/pub/yan
  • 10Yan T Y,Proceedings of the 1995 USENIX Technical Conference,1995年,177页

共引文献232

同被引文献10

引证文献3

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部