期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于市场匹配的多Agent智能爬虫系统
1
作者 刘佳 杜亚军 《西华大学学报(自然科学版)》 CAS 2016年第1期67-72,共6页
在网络文字、图像视频、音频数量日益增长的网络世界中,网络爬虫爬取结果变得越来越差,主要表现在爬取网页的精确率低、召回率低和重复率高等方面。为解决这些问题,结合市场匹配基本原理和网络爬虫的特点,提出一种基于市场匹配算法的多A... 在网络文字、图像视频、音频数量日益增长的网络世界中,网络爬虫爬取结果变得越来越差,主要表现在爬取网页的精确率低、召回率低和重复率高等方面。为解决这些问题,结合市场匹配基本原理和网络爬虫的特点,提出一种基于市场匹配算法的多Agent智能爬虫系统。基于市场匹配算法,设计了多Agent智能爬虫系统,以雅虎一级目录12个主题为测试数据对网络爬虫爬取网页的精确率、召回率和重复率进行了分析。结果表明,与未使用市场匹配算法的系统相比较,基于市场匹配算法的多Agent智能爬虫系统的精确率提高了9%、召回率提高了8%、重复率降低了5%,其爬虫性能有较大改善。 展开更多
关键词 市场匹配算法 多AGENT 智能爬虫
下载PDF
社区网络爬虫的设计与实现 被引量:10
2
作者 郭涛 黄铭钧 《智能计算机与应用》 2012年第4期65-67,共3页
社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值,由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面... 社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值,由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面为粒度,该爬虫以人为最小粒度,并以人与人之间的关系为抓取依据,在获取这类数据上有很好的性能。 展开更多
关键词 社区互联网 智能爬虫 数据挖掘
下载PDF
基于Lucene的校园信息搜索引擎的设计与实现 被引量:2
3
作者 杨单 《中南民族大学学报(自然科学版)》 CAS 2013年第4期97-101,共5页
利用Lucene开源全文本搜索技术框架建立了校园搜索引擎,设计并实现了资源采集、信息检索、数据检索等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的校园搜索引擎能满足校园用户的需要并提升了搜索的准确性.
关键词 智能网络爬虫 多线程 搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部