辛亥革命史主题爬虫的设计与实现
摘要
今年是辛亥革命100周年,该文在普通爬虫的技术基础上以主题相关性为核心构建辛亥革命史主题爬虫,从而保证该主题爬虫所搜集网页与辛亥革命主题相关,返回用户所需,做构建辛亥革命主题搜索引擎的前期工作。
出处
《电脑知识与技术》
2011年第5期3009-3010,3013,共3页
Computer Knowledge and Technology
参考文献4
-
1张岭.智能信息检索中的Web挖掘研究[D].上海:上海交通大学,2002.
-
2RuiChen,BIPinC.Desai,CongZhou.CINDIRobot:an Intelligent Web Crawler Based on Multi-level InsPeetion[C].Database Engineering and APPlications SymPosium,2007.IDEAS 2007.11 th International 6-8 SePt,2007:93-1 0 1.
-
3Srinivasan P,Menczer F,Gpant.A General Evaluation Framework for ToPical Crawlers[J].ACM SIGIR Conference on Research and DeveloPment in Information Retrieval,2005,8(3):4 1 7-447.
-
4金明珠,丁岳伟.基于动态主题库的主题爬虫[J].计算机应用,2009,29(B12):44-46. 被引量:4
二级参考文献7
-
1郑健珍,林坤辉,周昌乐,康恺.基于本体语义的定题爬虫[J].山东大学学报(理学版),2006,41(3):106-110. 被引量:11
-
2CHAU M, CHEN H. Comparison of three vertical search spiders [ J]. Computer, 2003, 36(5) : 56 - 62.
-
3ARASU A, CHO J, GARCIA-MOLINA H, et al. Searching the Web [ J]. ACM Transactions on Internet Technology, 2001,1 (1) : 2 -43.
-
4SHETTAR R, BHUPTANI R. A vertical search engine: Based on domain classifier[ J]. International Journal of Computer Science and Security, 2007, 2(4) : 18 -27.
-
5CHAKRABARTIA S, van den BERG M, DOM B. Focused crawling: A new approach to topic-specfic Web resource discovery [ EB/ OL]. [2009 - 04 - 10]. http://www. cse. iitb. ac. in/- soumen/ doc/www1999 f/pdf/www1999 f. pdf.
-
6LIU H, JANSSEN J C M, MILIOS E E. Using HMM to learn user browsing patterns for focused Web crawling[ J]. Data and Knowledge Engineering, 2006, 59(2) : 270 -29I.
-
7贺宏朝,何丕廉,高剑峰,黄昌宁.一种基于上下文的中文信息检索查询扩展[J].中文信息学报,2002,16(6):32-37. 被引量:25
共引文献4
-
1周登朋,谢康林.Lucene搜索引擎[J].计算机工程,2007,33(18):95-96. 被引量:23
-
2蔡勇,刘美玲,李玫,胡豪.一种中医药行业搜索引擎的推荐词产生方式[J].计算机系统应用,2013,22(5):151-154. 被引量:3
-
3吴岳廷,李石君.基于扩展主题特征库的领域主题爬虫[J].计算机工程与设计,2015,36(5):1342-1347. 被引量:2
-
4艾芳菊,尹虓寅.融合BTM与TextCNN的文本语义增强主题爬虫研究[J].软件导刊,2024,23(3):21-26.
-
1宋强.维护网络信息安全 助力和谐社会发展[J].重庆通信业,2011(5):6-9.
-
2杨长升,雷建平,Eric,郭建龙,张磊,徐洁云,贾中山.淘宝“暴动”[J].计算机应用文摘,2011(31):19-29.
-
3胡晓翠,陈建勋.对数码产品主题爬虫的设计与实现[J].计算机应用与软件,2010,27(2):203-205. 被引量:1
-
4汪斌,张云伟,刘健,陈晶.一种面向农业信息主题网络爬虫的设计[J].安徽农业科学,2009,37(20):9699-9700. 被引量:6
-
5汪涛,樊孝忠,顾益军,刘林.基于概念分析的主题爬虫设计[J].北京理工大学学报,2004,24(10):890-893. 被引量:10
-
6丁未.下一代仪器仪表发展框架——以泛能量为基础的感应共同体散论之一[J].中国仪器仪表,2011(1):27-28.
-
7陈方,谭爱平,成亚玲,文益民.主题爬虫技术研究综述[J].湖南工业职业技术学院学报,2008,8(5):13-16. 被引量:5
-
8刘林,汪涛,樊孝忠.主题爬虫的解决方案[J].华南理工大学学报(自然科学版),2004,32(z1):137-141. 被引量:10
-
9成都电子机械高等专科学校[J].实验科学与技术,2009,7(2).
-
10语录[J].经营管理者,2010(4):10-11.