检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

增量更新并行W eb爬虫系统被引量：8: 1; 作者徐文杰陈庆奎《计算机应用》 CSCD 北大核心 2009年第4期1117-1119,1127,共4页; 介绍了并行Web爬虫系统的总体结构,引入了增量更新爬虫策略,在提高Web海量数据更新效率的同时,考虑到机群中各个爬虫的能力不一,为了使机群中爬虫的能力得到充分应用,又提出了向量度量技术,解决了抓取任务和爬虫能力匹配的问题。对抓取... 展开更多; 关键词 Web数据抓取并行爬虫增量更新策略余弦向量法; 下载PDF 职称材料

基于Hadoop的分布式并行增量爬虫技术研究被引量：4: 2; 作者刘芳云张志勇李玉祥《计算机测量与控制》 2018年第10期269-275,308,共8页; 面对多媒体社交网络中在线视频的爆炸式增长,使用单机模式下爬虫提取新视频页面的效率低下,为此,提出一种基于Map/Reduce的并行算法,大大提高了爬虫的效率;但是为了进一步改善数据冗余问题,减少过时页面的更新,改进了一种精度感知增量... 展开更多; 关键词 HADOOP集群分布式爬虫并行爬虫增量爬虫刷新策略; 下载PDF 职称材料

基于多agent强化学习的语义Web爬虫设计: 3; 作者谢枫平《漳州师范学院学报（自然科学版）》 2010年第4期63-68,共6页; Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更... 展开更多; 关键词语义WEB 并行爬虫强化学习; 下载PDF 职称材料

基于采样的在线大图数据收集和更新: 4; 作者尹子都岳昆 +1 位作者张彬彬李劲《软件学报》 EI CSCD 北大核心 2020年第11期3540-3558,共19页; 互联网中,以网页、社交媒体和知识库等为载体呈现的大量非结构化数据可表示为在线大图.在线大图数据的获取包括数据收集和更新,是大数据分析与知识工程的重要基础,但面临着数据量大、分布广、异构和变化快速等挑战.基于采样技术,提出并... 展开更多; 关键词在线大图数据收集数据更新并行爬虫 SPARK; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部