基于网络爬虫机制的文献资源可用性监测技术

Availability Monitoring Technology of Literature Resources Based on Web Crawler

下载PDF

导出

摘要在信息化的时代背景下,对电子文献资源库的可用性进行监测,是科研及教学的一项重要保障。该文对基于网络爬虫机制的文献资源监测技术进行了研究,重点探讨了技术选型、HTML文档抓取以及DOM树解析等内容,并对文献资源特征和系统架构展开了分析。该技术以Web服务器访问端口为数据输入源,因而具有较强的平台无关性,能适应网络多样化的特点。 In the era of information technology,availability monitoring of electronic literature resources is important for scientific research and teaching.In this paper,we study the monitoring technology based on web crawler mechanism.We focus on technology selection,HTML document capturing,DOM parsing and analyzing the system architecture.This technology takes web services as data source,so it has strong platform independence and is adaptable for complex networks.

作者闵磊 MIN Lei(School of Education,Jianghan University,Wuhan,Hubei Province,430056 China)

机构地区江汉大学教育学院

出处《科技资讯》 2020年第27期5-7,共3页 Science & Technology Information

关键词网络爬虫电子资源可用性监测 HTML解析 Web crawler Literature resources Availability monitoring HTML parser

分类号 G647 [文化科学—高等教育学]

引文网络
相关文献

参考文献5

1侯洁茹,吕继续.基于Python的天猫商品爬虫技术[J].科技资讯,2019,17(32):10-10. 被引量：4
2何征强.电子资源使用监测系统实例研究[J].大学图书情报学刊,2017,35(2):105-108. 被引量：2
3李海燕,宓永迪.公共图书馆数字资源故障自动检测系统设计与实现——以浙江图书馆为例[J].内蒙古科技与经济,2015(18):62-63. 被引量：1
4王思敏,尹伊秋,宣静雯,马冲.基于网络爬虫技术的数字资源检测软件的设计与实现[J].现代电子技术,2019,42(10):132-135. 被引量：13
5鲁丰玲.基于Scrapy的招聘信息爬虫设计与实现[J].科技资讯,2019,17(20):7-10. 被引量：4

二级参考文献42

1徐革.电子资源评价之重要影响因子的灰色统计研究[J].现代图书情报技术,2005(11):82-85. 被引量：24
2徐革.电子资源评价之重要影响因子的调查研究[J].大学图书馆学报,2006,24(3):77-81. 被引量：55
3徐革.大学图书馆电子资源利用统计数据的获得模式评析[J].大学图书馆学报,2007,25(1):54-58. 被引量：41
4余玲,邓敏,梁晓天.基于用户满意度的图书馆整体电子资源使用评价模型[J].现代情报,2007,27(7):58-61. 被引量：24
5David Gourley, Brian Totty. HTTP权威指南[M].北京:人民邮电出版社,2012.
6传统阅读数字阅读齐发力(深聚焦-聚焦全民阅读)-人民网[EB/OL] . http://henan. people, com. cn/n/2015/0402/c351638- 24358221. html.
7虚拟网.数字图书馆推广工程网站[EB/OL].http://www.ndlib.cn/xnw2012/201201/t20120113_57986. htm.
8浙江图书馆办公室.浙江图书馆年报[Z].2010-2014.
9Naughton, Patrick Schildt,Herbert. Java 2:The Complete Reference [M] . Edition:New York : Osborne/McGraw - Hill.1999.
10Judge, J. ; Beadle, H. W. P. ; Chicharo,J.Sampling HTTP response packets for pre-diction of Web traffic volume statistics[J].Global Telecommunications Conference,1998. GLOBECOM 1998. The Bridge toGlobal Integration. IEEE. 1998, Volume :5. Pages: 2617-2622.

共引文献19

1袁永旭,张淑婷,赵晓婷,金鹏琛.基于爬虫技术的病案管理人才需求现状分析[J].中国病案,2020(9):3-7. 被引量：7
2史叶明.公共图书馆数字资源评估系统的构建——以南京图书馆为例[J].河南图书馆学刊,2019,39(6):9-11. 被引量：2
3汪小霞,普星.基于网络爬虫技术的数字资源检测软件的设计与实现[J].数字通信世界,2019(11):97-97. 被引量：2
4苏祺,何昌原,张永平.基于BP神经网络的早期火灾图像识别软件[J].消防科学与技术,2019,38(12):1723-1726. 被引量：4
5荀雪莲,姚文彬.大数据网络爬虫技术在智慧图书馆信息资源建设上的应用[J].北华航天工业学院学报,2020(4):20-22. 被引量：7
6文斌.基于Beautiful Soup爬虫招聘信息查询系统的设计与实现[J].电脑编程技巧与维护,2020(10):107-109. 被引量：1
7宋钰.基于Python爬虫技术的网络目录更新程序设计[J].现代信息科技,2020,4(18):20-22. 被引量：1
8王艳,蒋凌迪.基于Python个性化礼物推荐系统的设计与实现[J].信息与电脑,2020,32(22):97-99. 被引量：3
9杨松,刘佳欣.基于Python多重解析的图像爬虫的设计与实现[J].工业控制计算机,2021,34(2):99-101. 被引量：3
10冯现永.基于小波分析的图书馆电子阅览设备故障检测方法[J].自动化与仪器仪表,2021(2):46-49.

1姜蕾,王晶.水文资源监测中的问题和对策[J].丝路视野,2019(21):11-11.
2林晓萍.基于国产卫星影像的自然资源动态监测[J].测绘通报,2020(11):28-32. 被引量：21
3向兰宣.学生信息采集平台的设计与开发[J].电脑知识与技术,2020,16(32):93-95.
4张艺.数字政府环境下电子政务服务数据保密系统[J].科技通报,2020,36(8):44-47.
5贺春,刘大维,杨志华,鲁轩,李宁,晏鹏兵.绝缘子电晕放电远距离无接触紫外在线监测系统研究[J].中国农机化学报,2020,41(11):119-123. 被引量：2
6陈云.基于LwIP的GNSS基准站设计[J].电子设计工程,2020,28(23):143-148.

科技资讯

2020年第27期

浏览历史

内容加载中请稍等...

基于网络爬虫机制的文献资源可用性监测技术

参考文献5

二级参考文献42

共引文献19

相关作者

相关机构

相关主题

浏览历史