摘要
跨站脚本XSS是Web安全的主要威胁。在分析网页爬虫的爬取流程基础上,提出一种网络爬虫架构,根据特征集合对爬取的网页资源进行XSS漏洞分析。通过Java和Python环境下的实验测试,该爬虫架构能爬取到页面的细小方面,使用特征提取能够进行有效的识别。
XSS is a major threat to the Web security. After analyzed crawling process of Web crawler, a Web crawler architecture is proposed and the XSS vulnerability- of crawling Web resources is analyzed according to the feature set. The results of experimental under the Java and Python environment show that the crawler architecture can crawl to the small aspects of the Web page, and can be effectively identified by using feature extraction.
作者
齐晓霞
丁黄法
王琦进
QI Xiaoxia;DING Huangfa;WANG Qijin(College of lnformation Engbwering,Anhui Xinhua University,Hefei 230088 China)
出处
《西华大学学报(自然科学版)》
CAS
2018年第6期37-41,共5页
Journal of Xihua University:Natural Science Edition
基金
安徽省高等学校自然科学研究重点项目(KJ2016A311)
安徽省高等学校自然科学研究重点项目(KJ2018A0589)