期刊文献+

网页爬虫系统在云媒体中的应用 被引量:1

Application of Radar Crawler System in Cloud Media
下载PDF
导出
摘要 万维网上有无数的网页,包含着海量的信息,森罗万象。但很多时候,出于数据分析或产品需求,我们需要从某些网站提取出感兴趣有价值的内容。但纵然是进化到21世纪的人类,也不可能去每一个网页点看,然后再复制粘贴,所以我们需要一种能自动获取网页内容并可以按照指定规则提取相应内容的程序,这就是爬虫。理论上来说,任何支持网络通信的语言都是可以写爬虫的,爬虫本身虽然语言关系不大,但是总有相对顺手简单的。目前大多数爬虫是用后台脚本类语言写的,下面主要介绍爬虫的基本工作原理及如何在云媒体平台上得以应用。 There are countless web pages on the World Wide Web that contain a lot of information,but whether for data analysis or product requirements,we need to extract interesting and valuable content from certain sites. Even in the 21 th century,it is impossible to click into every page and then copy and paste the information from it. Therefore we need a program that automatically retrieves content and extracts the content according to the specified rules,which is called crawler. In theory,any language that supports network communication can write crawlers. Although the reptile itself has little to do with language,there is always a relative ease. Currently most of the crawlers are written in background script language. This article mainly introduces the basic principles of crawler and how to apply them in cloud media platform.
作者 沈洁 李一凡 SHEN Jie;LI Yifan(JSCN Baron New Media Technology Co.,Ltd,Nanjing 210001,China)
出处 《中国有线电视》 2018年第5期595-597,共3页 China Digital Cable TV
关键词 雷达 电视 管理 radar television management
  • 相关文献

参考文献1

二级参考文献5

  • 1何洪波,吴开超.科学数据库系统平台数据访问子系统的设计[J].微电子学与计算机,2005,22(2):33-34. 被引量:1
  • 2李澜,王峰,钱华林.LDAP目录服务安全及研究现状[J].微电子学与计算机,2005,22(6):48-52. 被引量:12
  • 3南凯 阎保平.科学数据库系统平台建设设想[A]..科学数据库与信息技术论文集(第六集)[C].北京:科学出版社,2002..
  • 4南凯,阎保平.中科院十五信息化建设项目--科学数据库及其应用系统项目系统平台设计方案[R].北京:中国科学院,2001
  • 5W Yeong,T Howes,S Kille.The lightweight directory access protocol.RFC1777,1995.3

共引文献4

同被引文献8

引证文献1

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部