集群式智能型网络信息自动搜寻与采集系统被引量：1

Automatic Network Information Retrieving System Based onCluster Mode with Intellectual Characteristic

下载PDF

导出

摘要互联网上分布的许多用于搜集网络信息的ＷｅｂＳｐｉｄｅｒｓ（网络爬虫）一般都工作在单机上，难以快速完成大规模的信息采集工作．对此提出了一种集群式Ｓｐｉｄｅｒ系统的构想，它能够使许多Ｓｐｉｄｅｒ工作在不同的主机上完成同一项任务（每个Ｓｐｉｄｅｒ负责一部分，可动态调整），因此可大大加速信息采集工作．文中描述了这种系统的体系结构与模型，并介绍了该系统的一种实现，即ＣｈｉｎａＷｅｂＷｉｚａｒｄ．它不仅可以在集群模式下工作，还能动态地发现新的站点．该系统为搜索引擎提供了底层支持，对网点建设者和开发者具有参考价值． There have been many spiders on the Web and they normally can run only on one machine.Here we suggest a system that belongs to the Spider family but has significant differences from others. It can work in cluster which means that many Spiders can host on many machines to perform one task and speed up the whole process. The article describes the system architecture and models and introduces an implementation of this system that is China Web Wizard and can work in cluster and dynamically find new Web sites. The system provides fundamental support for search engineers and has great reference values for Web site builder developers.

作者王宇张秀彬

机构地区上海交通大学信息与控制工程系

出处《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第8期36-41,共6页 Journal of Shanghai Jiaotong University

关键词搜索引擎 INTERNET 集群式智能型 CWWizard search engine Web spiders cluster mode HTTP server

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张秀彬,褚贵宏,王宇,李卫平.基于 PCL818HG 高速数据采集系统的设计[J].上海交通大学学报,1998,32(6):115-118. 被引量：2
2刘素丽（译），Internet编程，1996年
3方敏，网络环境下的编程技巧及实例，1996年
4郑全战（译），Windows NT高级编程技术，1994年
5周明天，TCP/IP网络原理与技术，1993年

二级参考文献5

1张秀彬,张颖璐.分布数据采集系统扩展法及评估原则[J].上海交通大学学报,1996,30(1):101-107. 被引量：6
2李卫平，硕士学位论文，1998年
3谭浩强，C程序设计，1994年
4张秀彬,张颖璐,孙威.检控通道扩展与混合编程研究[J].电子测量与仪器学报,1997,11(3):22-27. 被引量：2
5张颖璐,张秀彬,马殿光,王宇.用 TMS320C5X 评价模块实现的 PC 运算加速器[J].上海交通大学学报,1998,32(6):110-114. 被引量：1

共引文献1

1张秀彬,虞海燕,李卫平,薛明,姜建民.集装箱起重机制动动态特性模拟实验研究[J].机械设计与研究,1999,15(2):69-71.

同被引文献2

1杨华中，Java语言与程序设计，1997年
2王亭,赵轶群,秦耕.WebLight——一个集文档管理的综合搜索引擎[J].计算机系统应用,2000,9(1):22-25. 被引量：7

引证文献1

1谭淑英,刘丽华.Web Robot技术及其Java实现[J].中南工业大学学报,2001,32(3):325-327. 被引量：8

二级引证文献8

1黄初指.网络爬虫用于电力广域网信息收集的探讨[J].福建电力与电工,2008,28(3):38-41. 被引量：4
2杨晓蓉,赵维夷,丁麟.农业科技信息采集和深加工的分析思考[J].农业网络信息,2004(6):14-17. 被引量：2
3周军,迟呈英.基于校园网的中文搜索引擎系统[J].沈阳师范大学学报（自然科学版）,2006,24(1):55-57. 被引量：5
4张红斌.网上求职机器人的软件设计[J].华东交通大学学报,2006,23(1):109-112. 被引量：4
5杨娜,周长胜,马志强,丁维.基于校园网的搜索器技术研究与改进[J].计算机与数字工程,2007,35(3):135-136.
6马良俊,贺立源,苗洁,张轶.基于用户需求的农业知识服务系统设计与建立[J].农业网络信息,2007(2):37-41. 被引量：9
7陈勇,刘勇.中医药主题搜索网络机器人的设计与实现[J].计算机技术与发展,2010,20(5):162-166. 被引量：2
8黄崑,赖茂生.Web信息检索技术及研究进展[J].现代图书情报技术,2004(5):44-48. 被引量：5

1施昆松.多个数字温度传感器DS1820地址的自动搜寻[J].国外电子元器件,1997(1):4-6. 被引量：6
2徐晋.综合分析智能用电信息采集系统给电力营销管理造成的变化[J].现代工业经济和信息化,2016,6(13):96-97. 被引量：1
3杨红欣,齐火箭,徐海宾.用电信息多模采集终端的研究[J].电子世界,2016,0(2):115-119. 被引量：1
4香港成功研发脑机接口可将脑电波转成中文[J].科技与生活,2012(9):2-2.
5刘茸.我国将建立校车信息管理系统[J].安全与健康,2013(6):40-40.
6让IE4.0自动匹配更多后缀的URL[J].微电脑世界,1999,0(20):53-53.
7李婷,解旭辉.基于激光自动搜寻的微位移传感系统设计[J].传感器技术,2005,24(6):39-41. 被引量：1
8胡健,董跃华,杨炳儒.大型复杂网络中的社区结构发现算法[J].计算机工程,2008,34(19):92-93. 被引量：14
9杨勇,郑文娟,黄淑英,魏文明,刘心韵.一种基于遗传算法的自适应多聚焦图像融合新方法[J].中南大学学报（自然科学版）,2013,44(S2):228-231.
10张苗苗,谢剑英,方敏,徐国良.故障诊断的机械设备建模系统[J].农业机械学报,2000,31(1):100-103. 被引量：1

上海交通大学学报

1998年第8期

浏览历史

内容加载中请稍等...

集群式智能型网络信息自动搜寻与采集系统被引量：1

参考文献5

二级参考文献5

共引文献1

同被引文献2

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

集群式智能型网络信息自动搜寻与采集系统 被引量：1

参考文献5

二级参考文献5

共引文献1

同被引文献2

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

集群式智能型网络信息自动搜寻与采集系统被引量：1