期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web渗透测试的信息抓取策略研究
被引量:
2
1
作者
宋雅楠
刘萍
《计算机系统应用》
2017年第8期232-237,共6页
文章研究了在渗透测试中Web站点的信息抓取的问题.针对Web渗透测试对于信息抓取的全面性、高效性的需求,本文通过对Web站点进行研究分析,提出了基于导航链接的网络爬虫策略,并通过减少迭代次数对传统的MD5去重算法进行了改进,优化了URL...
文章研究了在渗透测试中Web站点的信息抓取的问题.针对Web渗透测试对于信息抓取的全面性、高效性的需求,本文通过对Web站点进行研究分析,提出了基于导航链接的网络爬虫策略,并通过减少迭代次数对传统的MD5去重算法进行了改进,优化了URL去重的效率.通过实验验证表明,该爬虫策略的信息抓取覆盖率和网页下载效率均有所提高.
展开更多
关键词
网络爬虫
web信息抓取
URL去重
MD5算法
覆盖率
下载PDF
职称材料
Web信息增量采集与保存管理平台的设计与实现
2
作者
赵丹阳
《无线互联科技》
2022年第23期68-71,共4页
随着网络的普及和发展,互联网资源已经成为人类文明记忆的载体,及时并完整的保存网络信息资源变得尤为重要。文章结合国家图书馆网络信息资源采集与保存工作的发展历程、技术发展和互联网信息更新快等特点,提出基于Heritrix开源架构的...
随着网络的普及和发展,互联网资源已经成为人类文明记忆的载体,及时并完整的保存网络信息资源变得尤为重要。文章结合国家图书馆网络信息资源采集与保存工作的发展历程、技术发展和互联网信息更新快等特点,提出基于Heritrix开源架构的网络信息增量采集与保存管理平台的设计和架构,并详细介绍平台在网络资源增量采集和增量回显一站式服务的实现技术,提升国家图书馆网络资源保存工作效率和服务质量的同时,以期为业界提供有益的参考和借鉴。
展开更多
关键词
web信息抓取
增量采集
增量回显
HERITRIX
平台构建
下载PDF
职称材料
企业外网应用系统在线评估研究与测试
3
作者
赵艳平
《太原科技大学学报》
2015年第2期113-117,共5页
企业外网应用系统作为企业面向社会和外部企业运营的通道,在提高企业运营效率的同时面临着来自互联网安全危险。因此研究实时在线信息安全评估与分析具有很重要的作用。本文结合企业互联网应用系统面临的信息安全现状,研究基于强化学习...
企业外网应用系统作为企业面向社会和外部企业运营的通道,在提高企业运营效率的同时面临着来自互联网安全危险。因此研究实时在线信息安全评估与分析具有很重要的作用。本文结合企业互联网应用系统面临的信息安全现状,研究基于强化学习的WEB信息抓取RLC模型,通过模型来完成WEB页面结构化、页面特征提取、链接特征抽取等任务,同时利用综合回报评价模型中的Q值评价算法评价链接的接口相关度,根据该接口相关度数值进行WEB信息抓取对象选择,为WEB信息抓取提供最优选择策略,减少对无效页面检测的次数,从而提高整体安全检测效率。
展开更多
关键词
企业外网应用系统
信息
安全
在线评估
web信息抓取
安全测试
下载PDF
职称材料
大数据时代下爬虫技术应用与研究——以标讯快车项目为例
被引量:
7
4
作者
黄文杰
姚庚梅
《科技创新与应用》
2018年第6期37-38,41,共3页
随着互联网快速发展和大数据时代的来临,Web数据逐渐庞大,如何有效并快速地从互联网上获取到用户自身需要的信息是亟需解决的问题,网络爬虫技术应运而生,它是搜索引擎抓取系统的重要组成部分。文章是以标讯快车项目为研究目标,依托本学...
随着互联网快速发展和大数据时代的来临,Web数据逐渐庞大,如何有效并快速地从互联网上获取到用户自身需要的信息是亟需解决的问题,网络爬虫技术应运而生,它是搜索引擎抓取系统的重要组成部分。文章是以标讯快车项目为研究目标,依托本学院在大数据方面的研究优势,结合该院IT特色,具有较强的实际意义和社会意义。
展开更多
关键词
JAVASCRIPT
网络爬虫
web信息抓取
下载PDF
职称材料
题名
Web渗透测试的信息抓取策略研究
被引量:
2
1
作者
宋雅楠
刘萍
机构
陆军军官学院
出处
《计算机系统应用》
2017年第8期232-237,共6页
基金
合肥市基本建设项目(2013CGFZ1948)
文摘
文章研究了在渗透测试中Web站点的信息抓取的问题.针对Web渗透测试对于信息抓取的全面性、高效性的需求,本文通过对Web站点进行研究分析,提出了基于导航链接的网络爬虫策略,并通过减少迭代次数对传统的MD5去重算法进行了改进,优化了URL去重的效率.通过实验验证表明,该爬虫策略的信息抓取覆盖率和网页下载效率均有所提高.
关键词
网络爬虫
web信息抓取
URL去重
MD5算法
覆盖率
Keywords
web
crawler
web
information extraction
URL de-emphasis
MD5 algorithm
coverage
分类号
TP393.0 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web信息增量采集与保存管理平台的设计与实现
2
作者
赵丹阳
机构
国家图书馆
出处
《无线互联科技》
2022年第23期68-71,共4页
文摘
随着网络的普及和发展,互联网资源已经成为人类文明记忆的载体,及时并完整的保存网络信息资源变得尤为重要。文章结合国家图书馆网络信息资源采集与保存工作的发展历程、技术发展和互联网信息更新快等特点,提出基于Heritrix开源架构的网络信息增量采集与保存管理平台的设计和架构,并详细介绍平台在网络资源增量采集和增量回显一站式服务的实现技术,提升国家图书馆网络资源保存工作效率和服务质量的同时,以期为业界提供有益的参考和借鉴。
关键词
web信息抓取
增量采集
增量回显
HERITRIX
平台构建
Keywords
web
information capture
incremental acquisition
incremental display
Heritrix
platform construction
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
G253 [文化科学—图书馆学]
下载PDF
职称材料
题名
企业外网应用系统在线评估研究与测试
3
作者
赵艳平
机构
安徽水利水电职业技术学院
出处
《太原科技大学学报》
2015年第2期113-117,共5页
文摘
企业外网应用系统作为企业面向社会和外部企业运营的通道,在提高企业运营效率的同时面临着来自互联网安全危险。因此研究实时在线信息安全评估与分析具有很重要的作用。本文结合企业互联网应用系统面临的信息安全现状,研究基于强化学习的WEB信息抓取RLC模型,通过模型来完成WEB页面结构化、页面特征提取、链接特征抽取等任务,同时利用综合回报评价模型中的Q值评价算法评价链接的接口相关度,根据该接口相关度数值进行WEB信息抓取对象选择,为WEB信息抓取提供最优选择策略,减少对无效页面检测的次数,从而提高整体安全检测效率。
关键词
企业外网应用系统
信息
安全
在线评估
web信息抓取
安全测试
Keywords
the network application system
information security
online assessment
web
information grasping
safety tests
分类号
TP309.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
大数据时代下爬虫技术应用与研究——以标讯快车项目为例
被引量:
7
4
作者
黄文杰
姚庚梅
机构
广东东软学院计算机科学与技术系
出处
《科技创新与应用》
2018年第6期37-38,41,共3页
基金
共青团广东省委员会2017年"攀登计划"广东大学生科技创新培育专项资金项目"大数据时代下爬虫技术应用与研究--以标讯快车项目为例"(编号:pdjh2017b0836)的阶段性研究成果
文摘
随着互联网快速发展和大数据时代的来临,Web数据逐渐庞大,如何有效并快速地从互联网上获取到用户自身需要的信息是亟需解决的问题,网络爬虫技术应运而生,它是搜索引擎抓取系统的重要组成部分。文章是以标讯快车项目为研究目标,依托本学院在大数据方面的研究优势,结合该院IT特色,具有较强的实际意义和社会意义。
关键词
JAVASCRIPT
网络爬虫
web信息抓取
Keywords
JavaScript
web
Crawler
web
information scraping
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web渗透测试的信息抓取策略研究
宋雅楠
刘萍
《计算机系统应用》
2017
2
下载PDF
职称材料
2
Web信息增量采集与保存管理平台的设计与实现
赵丹阳
《无线互联科技》
2022
0
下载PDF
职称材料
3
企业外网应用系统在线评估研究与测试
赵艳平
《太原科技大学学报》
2015
0
下载PDF
职称材料
4
大数据时代下爬虫技术应用与研究——以标讯快车项目为例
黄文杰
姚庚梅
《科技创新与应用》
2018
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部