基于网络爬虫技术进行网站智能应用的探讨
被引量:1
摘要
本文是关于网络爬虫技术的解决方案,详细介绍了以海量数据挖掘为基础的个性化推荐系统。同时提出了一种基于网络爬虫技术的网站应用方案,并进行了深入地研究和探讨,以帮助新闻类网站为其用户进行阅读推荐提供决策参考。
出处
《中国新通信》
2019年第5期87-88,共2页
China New Telecommunications
二级参考文献15
-
1Hemovici M, Jacovi M, Maarek Y S, et al. The Shark-Search Algorithm: An Application:Tailored Web Site Mapping[ C ]//Proceedings of the7th international World Wide Web 7 conference. Brisbane, Australia, 1998.
-
2Joson Rennie, Andrew Kachites McCallum. Using reinforcement learning to spider the web efficiently[ C ]//Proceedings of the 16th International Conference on Machine Learning( ICML - 99 ). Bled, Slovenia, 1999:335 - 343.
-
3Diligenti M, Coetzee F, Lawrence S, et al. Focused crawling using context graphs. Proceedings of the 26th International Conference on Very Large Database ( VLDB2000), 2000:527 - 534.
-
4Aggaewal C, A1-Garawif Yup. Intelligent crawling on the World Wide Web with arbitrary predicates[ C ]//Proc of the 10th International WoAd Wide Web Conference. HongKong: [ S n] ,2001.
-
5Maenehea Ehrig. Ontology-focused crawling of Web documents[ C ]//Proc of ACM Symposium on Applied Computing ,2003.
-
6Chakrabarti S, Punera K, Subramanyam M. Accelerated Focused Crawling through Online Relevance Feedback [ C ]//Proceedings of the 11 th International Conference on World Wide Web, Hawaii, USA ,2002 : 148 - 159.
-
7Cai Rui, Yang Jiang-ming, Wei lai. iRobot: An Intelligent Crawler for Web Forums [ A ]//Proceedings of the 17th International world Wide Web Conference[ C ]. ACM Press ,2008:447 - 456.
-
8Duskin O, Dror G. Feitelson distinguishing humans from robots in Web search logs:Preliminary results using query rates and intervals [ C ]// Proceedings of the 2009 Workshop on Web Search Click Data, New York :ACM ,2009:15 -19.
-
9曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,17(5):122-126. 被引量:39
-
10王舜燕,李蕾,吴兵华.基于ID3分类算法的深度网络爬虫设计[J].现代图书情报技术,2008(6):41-45. 被引量:4
共引文献26
-
1王娟,吴金鹏.网络爬虫的设计与实现[J].软件导刊,2012,11(4):136-137. 被引量:7
-
2焦改香.试谈社会信息意识的形成条件和影响因素[J].地震科技情报,2000(2):11-12.
-
3周峦,林芸,陈露诗.剖宫产术中出血相关因素的探讨[J].广东医学,2000,21(5):420-421. 被引量:1
-
4赵靖,潘志舟,梅芳婷,程振,钱吕见.多中文搜索引擎的联合网络爬虫及LUCENCE实现[J].安阳师范学院学报,2012(5):51-55.
-
5王春芳,高永兵.炼铁厂铁量网页数据获取系统的设计与实现[J].中国新通信,2016,18(21):121-121. 被引量:1
-
6郑豪,何彦雨.基于Java平台的分布式网络爬虫系统研究[J].科技创新与应用,2017,7(1):112-112. 被引量:5
-
7谢克武.大数据环境下基于python的网络爬虫技术[J].电子制作,2017,25(9):44-45. 被引量:50
-
8彭崧.基于异步JavaScript技术的水稻病虫害图像网络爬虫设计[J].科技视界,2017(7):166-166. 被引量:1
-
9刘宇,程学林.基于决策树算法的爬虫识别技术[J].软件,2017,38(7):122-125. 被引量:4
-
10方从刚,黄志勤,武椿江,辜寄蓉,兰井志.基于不动产统一登记数据的不动产大数据框架初探[J].中国国土资源经济,2017,30(9):30-34. 被引量:4
同被引文献4
-
1孙红,黎铨祺,赵娜.基于双层树状支持向量机的观点挖掘与倾向分析[J].智能计算机与应用,2021,11(3):44-47. 被引量:3
-
2冯昊,劳咏昶,叶玲洁,孙秋洁,康泰峰.基于网络爬虫的电网大数据智能挖掘技术研究[J].电子设计工程,2019,27(16):161-164. 被引量:10
-
3杨青,任晶.基于大数据挖掘和综合分析的应急管理案例库系统设计[J].行政科学论坛,2019,0(12):37-42. 被引量:1
-
4孟庆昊,沈妍,李青君,苏波.基于爬虫技术的医疗行业舆情监控系统的设计与实现[J].科技创新与应用,2022,12(8):27-29. 被引量:4