期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
搜索引擎中网络爬虫的设计
被引量:
3
下载PDF
职称材料
导出
摘要
本文从网络爬虫的介绍出发,阐述了网络爬虫的搜索策略以及相关算法,包括页面解析,重复链接分析,多线程等等。并详细介绍了在vc6.0下网络爬虫的具体实现。
作者
吴亮
机构地区
中国地质大学(武汉)信息工程学院
出处
《决策与信息(财经观察)》
2008年第7期139-140,共2页
关键词
搜索引擎
网络爬虫
分类号
G354 [文化科学—情报学]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
1
共引文献
0
同被引文献
21
引证文献
3
二级引证文献
9
参考文献
1
1
http://blog.csdn.net/olncy/archive/2008/05/04/2381497.aspx .
同被引文献
21
1
易红军,佘名高.
MD5算法与数字签名[J]
.计算机与数字工程,2006,34(5):44-46.
被引量:23
2
刘洁清,吴京慧.
面向主题的个人实时搜索引擎的设计与实现[J]
.现代图书情报技术,2006(5):40-43.
被引量:6
3
A.Rungsawang,N.Angkawattanawit.Learnable topic-specific web crawler[J].Journal of Network and Computer Applications,2005(28):97-114.
4
迈克·塞沃尔.链接分析:信息科学的研究方法[M].孙建军,李江,张煦,等.南京:东南大学出版社,2009:15.
5
Sotiris Batsakis,Euripides G.M.Petrakis,Evangelos Milios.Improving the performance of focused web crawlers[J].Data & Knowledge Engineering,2009(68):1001-1013.
6
徐远超,刘江华,刘丽珍,关永.
基于Web的网络爬虫的设计与实现[J]
.微计算机信息,2007,23(21):119-121.
被引量:36
7
李勇,韩亮.
主题搜索引擎中网络爬虫的搜索策略研究[J]
.计算机工程与科学,2008,30(3):4-6.
被引量:37
8
许鑫,章成志.
互联网舆情分析及应用研究[J]
.情报科学,2008,26(8):1194-1200.
被引量:62
9
王岩.
搜索引擎中网络爬虫技术的发展[J]
.电信快报(网络与通信),2008(10):20-22.
被引量:11
10
赵颖斯,刘云.
BBS舆情系统的数据采集方法[J]
.电信快报(网络与通信),2008(12):22-24.
被引量:3
引证文献
3
1
张旭,张振江,刘云.
BBS舆情系统爬虫模块的研究[J]
.铁路计算机应用,2010,19(12):18-21.
被引量:7
2
张安妮,姜华,郝相莲.
面向主题的快速搜索引擎的设计与研究[J]
.淮阴工学院学报,2011,20(3):12-15.
被引量:1
3
王春梅.
基于Bloom Filter的网络爬虫URL消重算法研究[J]
.产业与科技论坛,2011,0(18):55-56.
被引量:1
二级引证文献
9
1
熊志斌,王冬,尹成国.
舆情监测技术及应用综述[J]
.软件,2012,33(12):322-326.
被引量:2
2
李兆锋.
主题搜索引擎中的高效网页分类器构建方法[J]
.科技通报,2013,29(8):109-111.
被引量:1
3
邓炳光,郭慧兰,张治中.
移动互联网用户行为分析系统中聚焦爬虫的设计与实现[J]
.重庆邮电大学学报(自然科学版),2015,27(3):359-365.
被引量:4
4
吴柳,程恺,胡琪.
基于文本挖掘的论坛热点问题时变分析[J]
.软件,2017,38(4):47-51.
5
马凯凯,钱亚赫,阮东跃.
基于文本频率页面分割算法对论坛正文提取[J]
.中国水运(下半月),2018,18(2):78-79.
6
冯扬.
一种基于RabbitMQ的论坛舆情爬取方案及实现[J]
.网络安全技术与应用,2018(10):47-48.
7
金昌锦.
特定百度贴吧热帖采集系统设计与实现[J]
.福建电脑,2019,35(11):96-97.
8
王艳阁.
面向微博爬虫系统的分析[J]
.河南科技,2013,32(2X):16-17.
9
楼小帆,吴军,马严,林昭文.
基于LDA模型的高校论坛热点提取系统[J]
.华中科技大学学报(自然科学版),2016,44(S1):186-189.
被引量:4
1
权彦清.
改进日常生活中应用计算机检索信息的探讨[J]
.经营管理者,2010(23):367-367.
被引量:1
2
朱虎明,樊来耀.
数字图书馆中统一检索系统的开发[J]
.情报科学,2004,22(9):1100-1102.
被引量:4
3
李英.
信息搜索十大攻略[J]
.图书馆工作与研究,2012(9):102-104.
被引量:1
4
季春.
科技查新工作中搜索策略的制定与改进[J]
.情报探索,2006(11):75-77.
被引量:2
5
吴英梅,黄婧,郝永艳.
国内外FAQ研究综述[J]
.长春工业大学学报(社会科学版),2009,21(2):113-115.
被引量:4
6
卓佳,张俊坤,李畅.
基于向量空间模型的信息检索[J]
.华南金融电脑,2008,16(8):42-44.
7
朱庆生,邹景华.
基于本体论的论文检索[J]
.计算机科学,2005,32(5):172-173.
被引量:20
8
程秀峰,李重阳,陈莉玥.
基于关联规则的高校图书馆微博关注趋势分析[J]
.图书情报工作,2014,58(8):73-78.
被引量:7
9
袁庆.
情报研究工作中Web查询的应用[J]
.航空与航天,2008,28(2):14-18.
10
马静.
Internet上的灰色文献研究[J]
.图书馆杂志,2002,21(10):27-30.
被引量:5
决策与信息(财经观察)
2008年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部