基于兴趣模型的WEB信息预测采集过滤方法被引量：3

Forecast and Filter Method for Web Page Gathering Based on Interested Model

下载PDF

导出

摘要 Web网上海量信息急速膨胀使得有效定向采集相关信息检索成为网上信息查询一个日益重要的研究方向。该文提出一种基于用户兴趣模型的Web文本信息预测采集过滤方法。这种方法根据正反集文本过滤方法,设计出一种用户兴趣模型,并在对Web站点结构进行分析的基础上,通过对网页的相关度的预测来控制信息的采集。在保持定向采集精度的同时,缩短采集时间、减少存储、加快检索,节约了网络资源。 Following rapid expansion of huge information on Web,the efficient Web information gathering on specified fields becomes more important in information retrieval research.Based on the interested model of user,this paper presents the Forecast and Filter Method for Web page Gathering.The method applies text filter with plus and minus sets provided by user to design the interested model.Forecast for the relativity of Web page controlled the gathering,based on the analysis of Website structure.Gathering time shortened,storage decreased,retrieval speeded,net resources saved.

作者李振星徐泽平唐卫清唐荣锡

机构地区北京航空航天大学机械工程及自动化学院中国科学院计算所

出处《计算机工程与应用》 CSCD 北大核心 2003年第5期3-5,16,共4页 Computer Engineering and Applications

基金 1999~2000年度国家技术创新项目″中国技术创新网″建设 2002年的″中国技术创新网″升级改造项目国家经贸委国家重点技术创新项目"中国技术创新信息网系统开发"中信息采集检索部分

关键词兴趣模型信息预测采集过滤方法信息采集文本过滤 WEB 网络资源网页 INTERNET 信息检索 Information Gathering,Interested Model,Text Filtering

分类号 TP393.4 [自动化与计算机技术—计算机应用技术] G354.4 [文化科学—情报学]

引文网络
相关文献

参考文献6

1王继成,邹涛,杨小江,潘金贵,张福炎.基于Internet的信息资源发现技术与实现[J].计算机研究与发展,1999,36(11):1369-1374. 被引量：35
2邹涛,王继成,朱华宇,金翔宇,张福炎.WWW上的信息挖掘技术及实现[J].计算机研究与发展,1999,36(8):1019-1024. 被引量：120
3张卫丰,徐宝文.Web搜索引擎框架研究[J].计算机研究与发展,2000,37(3):376-378. 被引量：48
4林鸿飞,李业丽,姚天顺.中文文本过滤的信息分流机制[J].计算机研究与发展,2000,37(4):470-476. 被引量：16
5姚国祥,罗伟其,沈镇林.网上信息搜索技术与搜索引擎[J].计算机科学,2000,27(7):35-38. 被引量：9
6田范江,李丛蓉,王鼎兴.进化式信息过滤方法研究[J].软件学报,2000,11(3):328-333. 被引量：23

二级参考文献27

1李水平，小型微型计算机系统，1998年，19卷，4期，74页
2Salton G，Commun ACM，1975年，18卷，11期，613页
3王珊，数据仓库技术与联机分析处理，1998年
4Eichstaedt M，6th International Workshop on Solving Irregularly Structured Problems in Paralle，1998年，17页
5程学旗，中文信息处理国际会议论文集，1998年，418页
6Lu Qi，Computer Networks ISDN Systems，1997年，30卷，7期，443页
7姚天顺，自然语言理解，1995年
8Yan T W，Proc of 3 rd International Conference on Parallel andDistributed Information Sys，1994年，89页
9Yan T W，Proc of 1995 U SENIX Technical Conf.Http://www-db.standford.edu/pub/yan
10Yan T Y，Proceedings of the 1995 USENIX Technical Conference，1995年，177页

共引文献232

1张卫丰,徐宝文,周晓宇,许蕾,李东.元搜索引擎结果生成技术研究[J].小型微型计算机系统,2003,24(1):34-37. 被引量：7
2郭海凤.基于网页的图像检索技术研究[J].科技信息,2008(26):66-66.
3杨万春.基于访问控制的内部网搜索引擎[J].科技信息,2009(1).
4宋聚平,王永成.搜索引擎中的信息存储技术[J].计算机工程,2000,26(S1):716-720.
5胡俊华,杨波,李金屏.自然语言理解研究略述[J].济南大学学报（社会科学版）,2001,11(5):58-62. 被引量：8
6戴文军,朱立谷,孙志伟,任勇,曾赛峰,郝玮.一种基于搜索引擎的对象存储系统的扩展技术[J].计算机研究与发展,2007,44(z1):126-129.
7卢小华.WWW信息挖掘技术及其在水利水电领域中的应用[J].湖北水力发电,2003(1):69-71.
8周涛,李军,陆惠玲.WEB数据挖掘技术研究[J].汉中师范学院学报,2004,22(3):86-90. 被引量：1
9冯华.基于网络文本分类技术的应用研究[J].科协论坛（下半月）,2009(11):40-40.
10金泰松,耿增民.一个面向电离辐射计量领域的Web挖掘平台[J].核标准计量与质量,2008,0(1):41-48.

同被引文献10

1余侠,朱林.根据用户反馈建立和更新数字图书馆用户兴趣模型[J].情报杂志,2004,23(11):21-22. 被引量：16
2李荣陆,张永奎.一种基于多实例的自适应用户模型[J].计算机工程与应用,2002,38(5):92-93. 被引量：4
3欧洁,林守勋,李锦涛.数字图书馆中的个性化信息检索[J].微电子学与计算机,2002,19(7):1-4. 被引量：18
4郭家义.数字图书馆个性化服务中用户信息行为的收集与分析[J].图书馆杂志,2003,22(1):25-27. 被引量：30
5王艳.数据挖掘在数字图书馆中的应用[J].情报科学,2003,21(2):211-214. 被引量：40
6王志军,于超.基于隐式反馈的个人信息检索技术及实现[J].计算机工程,2003,29(6):158-159. 被引量：8
7黄晓斌.论图书馆用户的网络调查方法[J].中国图书馆学报,2003,29(3):39-43. 被引量：24
8石晶,龚震宇,裘杭萍,张毓森.基于用户兴趣模型的智能信息检索系统技术与实现[J].情报学报,2003,22(3):282-286. 被引量：18
9李勇,苏新宁,邓三鸿,任皓,周军,孔敏.企业知识发现中的个性化Web推荐服务研究[J].情报学报,2003,22(3):347-353. 被引量：7
10杨涛,王云莉,肖田元,张林宣.主动设计知识服务系统中的用户建模研究[J].系统仿真学报,2003,15(2):155-157. 被引量：6

引证文献3

1余侠,朱林.根据用户反馈建立和更新数字图书馆用户兴趣模型[J].情报杂志,2004,23(11):21-22. 被引量：16
2朱林,余侠.基于Web文档的目标信息预测采集控制策略[J].情报理论与实践,2005,28(6):660-662. 被引量：1
3王琪.半导体集成电路标准概述[J].信息技术与标准化,2006(3):25-28. 被引量：6

二级引证文献23

1陈翔,杨音,季炜炜,徐钦,魏敏.南京市集成电路产业技术标准体系构建研究[J].中国标准化,2021(9):113-116. 被引量：2
2彭博,崔波,吴亚光,李丽霞,郑镔.IEC TC47/SC47D标准体系研究[J].标准科学,2023(S01):27-32. 被引量：1
3庞秀丽,冯玉强,姜维.电子商务个性化文档推荐技术研究[J].中国管理科学,2008,16(S1):581-586. 被引量：10
4朱林,余侠.基于Web文档的目标信息预测采集控制策略[J].情报理论与实践,2005,28(6):660-662. 被引量：1
5王琪.半导体集成电路标准概述[J].信息技术与标准化,2006(3):25-28. 被引量：6
6李以正.基于用户反馈与协同过滤的情报检索系统的建立[J].情报杂志,2007,26(2):129-131. 被引量：4
7曹强.图书馆个性化信息服务模型的设计与实现[J].情报杂志,2007,26(4):80-83. 被引量：25
8杨晓静.电子专用设备标准化现状与展望[J].电子工业专用设备,2007,36(9):8-11.
9陈丽纳.提醒服务在数字图书馆中的实现[J].江西图书馆学刊,2007,37(4):75-77. 被引量：2
10周晓兰.基于XML的WEB数据挖掘系统研究[J].湖南工业大学学报,2008,22(4):37-40.

1李振星,陆大珏,任继成,唐卫清,唐荣锡.基于潜在语义索引的Web信息预测采集过滤方法[J].计算机辅助设计与图形学学报,2004,16(1):142-147. 被引量：9
2杜素芳.基于主题的教育信息定向采集系统的设计[J].计算机光盘软件与应用,2014,17(13):234-234. 被引量：1
3黄怀亮.CGI技术及其应用[J].计算机应用研究,1999,16(3):75-77. 被引量：3
4王桂云.基于Robot搜索引擎的信息检索技术[J].甘肃科技,2002,18(11):21-22. 被引量：2
5汪锦龙.论远程教育中数据查询的实现[J].南通职业大学学报,2000,14(4):20-23. 被引量：1
6宋凯伦,邱广华,李珊.基于Web的定向信息采集系统的设计与实现[J].福建电脑,2011,27(11):18-19. 被引量：1
7张莉华.基于Agent技术的电子商务系统的设计[J].商场现代化,2008(35):166-167.
8宫进,胡长军,曾广平.互联网信息定向采集系统的设计与实现[J].计算机应用,2007,27(B06):16-17. 被引量：7
9绵阳市启用云办公平台[J].中国信息界,2014(6):9-9.
10张忠林,王曰芬.网上信息查询——快、准、全[J].情报科学,2000,18(3):258-260. 被引量：7

计算机工程与应用

2003年第5期

浏览历史

内容加载中请稍等...

基于兴趣模型的WEB信息预测采集过滤方法被引量：3

参考文献6

二级参考文献27

共引文献232

同被引文献10

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于兴趣模型的WEB信息预测采集过滤方法 被引量：3

参考文献6

二级参考文献27

共引文献232

同被引文献10

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于兴趣模型的WEB信息预测采集过滤方法被引量：3