网页爬虫系统在云媒体中的应用被引量：1

Application of Radar Crawler System in Cloud Media

下载PDF

导出

摘要万维网上有无数的网页,包含着海量的信息,森罗万象。但很多时候,出于数据分析或产品需求,我们需要从某些网站提取出感兴趣有价值的内容。但纵然是进化到21世纪的人类,也不可能去每一个网页点看,然后再复制粘贴,所以我们需要一种能自动获取网页内容并可以按照指定规则提取相应内容的程序,这就是爬虫。理论上来说,任何支持网络通信的语言都是可以写爬虫的,爬虫本身虽然语言关系不大,但是总有相对顺手简单的。目前大多数爬虫是用后台脚本类语言写的,下面主要介绍爬虫的基本工作原理及如何在云媒体平台上得以应用。 There are countless web pages on the World Wide Web that contain a lot of information,but whether for data analysis or product requirements,we need to extract interesting and valuable content from certain sites. Even in the 21 th century,it is impossible to click into every page and then copy and paste the information from it. Therefore we need a program that automatically retrieves content and extracts the content according to the specified rules,which is called crawler. In theory,any language that supports network communication can write crawlers. Although the reptile itself has little to do with language,there is always a relative ease. Currently most of the crawlers are written in background script language. This article mainly introduces the basic principles of crawler and how to apply them in cloud media platform.

作者沈洁李一凡 SHEN Jie;LI Yifan(JSCN Baron New Media Technology Co.,Ltd,Nanjing 210001,China)

机构地区江苏有线邦联新媒体科技有限公司

出处《中国有线电视》 2018年第5期595-597,共3页 China Digital Cable TV

关键词雷达电视管理 radar television management

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1赵洪东,杨德婷,王庆阳,南凯,阎保平.基于网格服务的数据库统一查询系统的设计与实现[J].微电子学与计算机,2007,24(2):5-8. 被引量：5

二级参考文献5

1何洪波,吴开超.科学数据库系统平台数据访问子系统的设计[J].微电子学与计算机,2005,22(2):33-34. 被引量：1
2李澜,王峰,钱华林.LDAP目录服务安全及研究现状[J].微电子学与计算机,2005,22(6):48-52. 被引量：12
3南凯阎保平.科学数据库系统平台建设设想[A]..科学数据库与信息技术论文集(第六集)[C].北京:科学出版社,2002..
4南凯,阎保平.中科院十五信息化建设项目--科学数据库及其应用系统项目系统平台设计方案[R].北京:中国科学院,2001
5W Yeong,T Howes,S Kille.The lightweight directory access protocol.RFC1777,1995.3

共引文献4

1高希斌,孙朋,周维,杨德婷,阎保平.数据网格中服务状态和生命周期机制的设计与实现[J].计算机应用研究,2007,24(8):246-247.
2廖长均,刘鹏,李振华.基于网格的大规模VOD系统实现机制研究[J].微电子学与计算机,2009,26(4):22-25. 被引量：1
3李一凡,孙岩,黄艳萍.智慧党建平台开发建设[J].中国有线电视,2018(4):506-509.
4李志勇,张曾.智慧政企业务的研究与拓展[J].中国有线电视,2020,0(4):396-397.

同被引文献8

1刘宇,郑成焕.基于Scrapy的深层网络爬虫研究[J].软件,2017,38(7):111-114. 被引量：29
2熊畅.基于Python爬虫技术的网页数据抓取与分析研究[J].数字技术与应用,2017,35(9):35-36. 被引量：48
3孙冰.基于Python的多线程网络爬虫的设计与实现[J].网络安全技术与应用,2018(4):38-39. 被引量：15
4余豪士,匡芳君.基于Python的反反爬虫技术分析与应用[J].智能计算机与应用,2018,8(4):112-115. 被引量：14
5晋振杰,曹少中,项宏峰,王明道,李新佩.基于Python的电商书籍数据爬虫研究[J].北京印刷学院学报,2018,26(3):39-42. 被引量：5
6高宇,杨小兵.基于聚焦型网络爬虫的影评获取技术[J].中国计量大学学报,2018,29(3):299-303. 被引量：6
7冯俐.爬虫技术综述[J].电脑知识与技术,2017,13(9X):213-214. 被引量：8
8胡非,韩永辉,许超,周巧妮.基于Python的可视化工具研究与应用[J].工程技术研究,2018,3(13):25-26. 被引量：9

引证文献1

1葛琳,杨娜.Python招聘数据分析[J].计算机与网络,2020,46(16):62-65. 被引量：10

二级引证文献10

1李艳,丁国强,张庆.网络招聘数据可视化系统的设计与实现[J].信息与电脑,2021,33(1):112-115. 被引量：2
2宋超,华臻.Python数据工具在高职院校市场调研中的应用[J].电脑编程技巧与维护,2021(2):57-58. 被引量：1
3刘一,王跟成.基于Python的就业趋势可视化分析系统[J].信息与电脑,2021,33(5):99-101. 被引量：4
4陈昕,阮永娇,曹景胜,陈娅鑫,孙承臻.基于Python的汽车安全气囊跌落实验数据分析[J].辽宁工业大学学报（自然科学版）,2021,41(4):232-235. 被引量：2
5范雨轩,孙杰,周树功,周庆平.基于Python的学士学位论文线上评价数据的分析与统计研究[J].信息与电脑,2021,33(15):175-177. 被引量：1
6李建豪,林绮洁,李杰华,马坚辉,廖志勇.数据挖掘在大学生就业领域中的应用[J].福建电脑,2022,38(6):27-30.
7马妍妍.基于Python的招聘岗位数据分析与可视化[J].信息记录材料,2022,23(9):132-135. 被引量：1
8赵天泽,胡学友,张胜.基于自适应指数平滑法的甲醇价格预测[J].蚌埠学院学报,2023,12(2):113-117. 被引量：1
9李静.网络文本分析在农村电商人才需求分析的应用[J].福建电脑,2023,39(4):53-57.
10朱毅,赵佳妮.语言智能人才前景分析系统的实践与探索[J].科技与创新,2024(1):181-183.

1陈猛.基于Python的新浪新闻爬虫系统的设计与实现[J].现代信息科技,2018,2(7):111-112. 被引量：4
2李玲.关联数据及其研究发展现状[J].市场周刊·理论版,2017,0(21):243-243.
3曹根源,董斌智.基于JAVA的京东商品分布式爬虫系统的设计与实现[J].电子技术与软件工程,2018(16):184-185.
4宋明月.大姐不赔本[J].当代工人,2018,0(14):55-55.
5五大改变世界的互联网“第一”[J].时代英语（高一版）,2018,0(4):13-14.
6张欣瑞.有一种花开叫执着[J].故事家,2018,0(6):74-74.
7李代祎,谢丽艳,钱慎一,吴怀广.基于Scrapy的分布式爬虫系统的设计与实现[J].湖北民族学院学报（自然科学版）,2017,35(3):317-322. 被引量：17
8苏健光,赵颖,麦文武,胡宏蕾,庞锐华,陆钊.中药材行情数据的并行爬取方案[J].信息技术与信息化,2018(4):27-30. 被引量：1
9杨华,董华敏.计算机同名惹麻烦[J].网络安全和信息化,2018,0(6):145-146.
10陈辉映,张大兴,杨珊珊,郭家伟.基于SURF的图像多区域复制粘贴篡改检测[J].计算机工程与设计,2018,39(8):2593-2597. 被引量：10

中国有线电视

2018年第5期

浏览历史

内容加载中请稍等...

网页爬虫系统在云媒体中的应用被引量：1

参考文献1

二级参考文献5

共引文献4

同被引文献8

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

网页爬虫系统在云媒体中的应用 被引量：1

参考文献1

二级参考文献5

共引文献4

同被引文献8

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

网页爬虫系统在云媒体中的应用被引量：1