基于SVM的动态网页爬取方法研究

Research on Dynamic Web Page Crawling Method Based on SVM

下载PDF

导出

摘要文章提出一种基于支持向量机(Support Vector Machine,SVM)的动态网页识别方法,并结合Scrapy开源网络爬虫框架构建了动态网页的网络爬虫,实现了对动态网页的高效识别和内容抓取。以httpbin.org为测试网站,使用SVM模型对静态和动态网页进行分类,随后利用Scrapy框架动态调整抓取策略,验证了该方法的可行性和有效性。 This paper proposes a dynamic web page recognition method based on Support Vector Machine(SVM),and combines it with the Scrapy open source web crawler framework to build a web crawler for dynamic web pages,achieving efficient recognition and content capture of dynamic web pages.This paper uses httpbin.org as the test website,uses the SVM model to classify static and dynamic web pages,and then uses the Scrapy framework to dynamically adjust the crawling strategy to verify the feasibility and effectiveness of this method.

作者刘君良栾永明赵建楠任川 LIU Junliang;LUAN Yongming;ZHAO Jiannan;REN Chuan(Liaoning Provincial Meteorological Information Center,Shenyang Liaoning 110000,China)

机构地区辽宁省气象信息中心

出处《信息与电脑》 2024年第4期185-187,共3页 Information & Computer

关键词支持向量机(SVM) 动态网页识别 Scrapy框架网络爬虫 Support Vector Machine(SVM) dynamic web page recognition Scrapy framework web crawler

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1王芳,张睿,宫海瑞.基于Scrapy框架的分布式爬虫设计与实现[J].信息技术,2019,43(3):96-101. 被引量：14
2钱程,阳小兰,朱福喜.基于Python的网络爬虫技术[J].黑龙江科技信息,2016(36):273-273. 被引量：27
3王振武,孙佳骏,于忠义,卜异亚.基于支持向量机的遥感图像分类研究综述[J].计算机科学,2016,43(9):11-17. 被引量：52
4张松兰.支持向量机的算法及应用综述[J].江苏理工学院学报,2016,22(2):14-17. 被引量：29
5林香亮,袁瑞,孙玉秋,王超,陈长胜.支持向量机的基本理论和研究进展[J].长江大学学报（自然科学版）,2018,15(17):48-53. 被引量：38
6李晓薇.JavaScript在动态网页设计中的应用研究[J].信息系统工程,2019,0(1):87-87. 被引量：5
7张云苑.JavaScript在动态网页设计中的应用[J].科技信息,2007(5):23-24. 被引量：15
8贺军忠.ASP动态网页技术[J].电子技术与软件工程,2017(18):21-21. 被引量：4
9李丽.计算机动态网页设计中多元素应用探讨[J].黑龙江科学,2014,5(9):250-250. 被引量：3

二级参考文献112

1陈立波,宋兰琪,宋科,张占纲.基于支持向量机的航空发动机磨损趋势预测[J].润滑与密封,2008,33(5):84-87. 被引量：6
2陈琳,刘俊民,刘小学.支持向量机在地下水水质评价中的应用[J].西北农林科技大学学报（自然科学版）,2010,38(11):221-226. 被引量：11
3李元诚,方廷健.小波支持向量机[J].模式识别与人工智能,2004,17(2):167-172. 被引量：13
4郑水波,唐厚君,韩正之,张勇.基于支持向量机的ESP系统传感器故障诊断方法[J].系统仿真学报,2005,17(3):682-684. 被引量：5
5冼广淋,骆雪超,肖宇峰.统计学习理论与支持向量机[J].中国科技信息,2005(12C):178-178. 被引量：9
6袁胜发,杜红霞.基于支持向量机和人工免疫的机械故障诊断方法研究[J].制造技术与机床,2005(10):28-31. 被引量：1
7孔锐,张冰.一种快速支持向量机增量学习算法[J].控制与决策,2005,20(10):1129-1132. 被引量：31
8王博,韩合.内梅罗指数法在水质评价中的应用及缺陷[J].中国城乡企业卫生,2005,20(6):16-17. 被引量：31
9王平,毛剑琴.支持向量机训练算法及其应用[J].信息与电子工程,2005,3(4):309-314. 被引量：9
10黄勇,郑春颖,宋忠虎.多类支持向量机算法综述[J].计算技术与自动化,2005,24(4):61-63. 被引量：33

共引文献177

1苏帅星,李素敏,施友丽,袁利伟.郑州市CBD区域的遥感影像分类算法研究[J].中国水运（下半月）,2020(12):52-54.
2魏良针.基于支持向量机的铁路周边地表沉降变形量预测[J].中国安全生产科学技术,2019,15(S01):90-94. 被引量：5
3朱范炳,陈泽,张翔.基于改进蜂群算法优化的支持向量机研究与应用[J].智能计算机与应用,2023,13(8):197-200.
4李美.IPTV机顶盒嵌入式浏览器的设计与实现[J].牡丹江大学学报,2009,18(1):107-109.
5么炜,王雷,陈永峰,程洪.基于WebGIS的有线电视网络监控系统的研究与实现[J].中国市场,2009(1):54-55. 被引量：4
6芮文艳.基于JavaScript控制页面样式的研究[J].福建电脑,2009,25(4):144-144. 被引量：3
7熊圣芬,贺智明,王俊.基于JavaScript和DOM的动态表单设计及数据提交[J].江西理工大学学报,2009,30(1):31-33. 被引量：4
8陈永峰.基于WebGIS的有线电视网络监控系统的研究[J].河北软件职业技术学院学报,2009,11(1):62-64.
9李锦青.WEB UI控件库的开发[J].长春理工大学学报（自然科学版）,2009,32(1):129-131. 被引量：2
10曾勇.在线课件制作系统的设计与实现[J].科技信息,2010(28). 被引量：1

1《机械工程材料》编辑部.《机械工程材料》网上投稿[J].机械工程材料,2024,48(2):110-110.
2《机械工程材料》编辑部.《机械工程材料》网上投稿[J].机械工程材料,2023,47(12):97-97.
3柴源.基于视觉识别技术的无人机抓取功能研究[J].木工机床,2024(1):5-8.
4魏子钧,程光,陈子涵.一种基于应用数据单元长度的加密网页识别方法[J].网络空间安全科学学报,2023,1(3):3-12.

信息与电脑

2024年第4期

浏览历史

内容加载中请稍等...

基于SVM的动态网页爬取方法研究

参考文献9

二级参考文献112

共引文献177

相关作者

相关机构

相关主题

浏览历史