期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
搜索引擎增量式搜集的实现与评测 被引量:3
1
作者 雷凯 王东海 《计算机工程》 CAS CSCD 北大核心 2008年第13期78-80,106,共4页
针对传统的周期性集中式搜索(Crawler)的弱点和增量式Crawler的难点,提出预测更新策略,给出判别网页更新的MD5算法、URL调度算法和URL缓存算法,描述系统各个模块的分布式构架的实现,建立测试集数据对算法进行评测。该系统在北大天网搜... 针对传统的周期性集中式搜索(Crawler)的弱点和增量式Crawler的难点,提出预测更新策略,给出判别网页更新的MD5算法、URL调度算法和URL缓存算法,描述系统各个模块的分布式构架的实现,建立测试集数据对算法进行评测。该系统在北大天网搜索引擎上运行半年多,更新周期缩短了20天,变化预测命中率达到79.4%,提高了时效性、扩展性和稳定性。 展开更多
关键词 增量式搜集 网页变化预测 搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部