期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Jsoup爬虫的BOSS直聘信息爬取 被引量:1
1
作者 张鹏 《无线互联科技》 2023年第2期106-108,共3页
当前,就业成为人们生产生活的重要主题,随着互联网的飞速发展,招聘网站成为求职者就业的主要通道,网站中的招聘职位虽然丰富,但较难迅速获取岗位中的重要信息。文章采取Jsoup网络爬虫技术,爬取了BOSS直聘网站中天津市的Java岗位信息,并... 当前,就业成为人们生产生活的重要主题,随着互联网的飞速发展,招聘网站成为求职者就业的主要通道,网站中的招聘职位虽然丰富,但较难迅速获取岗位中的重要信息。文章采取Jsoup网络爬虫技术,爬取了BOSS直聘网站中天津市的Java岗位信息,并使用POI技术将岗位中的重要信息经过数据处理保存为本地Excel文件,便于求职者直观地对所搜索的岗位进行筛选判断,具有良好的实用价值。 展开更多
关键词 jsoup 网络爬虫 Boss直聘
下载PDF
基于爬虫和LeanCloud数据存储的双语阅读平台设计 被引量:2
2
作者 许清媛 刘韦声 《电子设计工程》 2018年第2期35-38,44,共5页
针对移动开发者在移动应用开发的过程中,经常需要用到大量数据信息的问题,提出一种利用爬虫技术获取网络上的数据,并结合Lean Cloud进行数据存储,从而为开发者提供海量数据的技术方案。Jsoup是用Java语言开发的知名度较高的Java第三方类... 针对移动开发者在移动应用开发的过程中,经常需要用到大量数据信息的问题,提出一种利用爬虫技术获取网络上的数据,并结合Lean Cloud进行数据存储,从而为开发者提供海量数据的技术方案。Jsoup是用Java语言开发的知名度较高的Java第三方类库,已经成为Java爱好者解析HTML文档的首选之一,并被广泛用于网络爬虫抓取海量网络数据。文中以Android双语阅读平台为例,通过Jsoup网络爬虫抓取网络数据和Lean Cloud进行数据存储开发了一款Android双语阅读平台,软件响应速度快、信息处理速度快。 展开更多
关键词 jsoup网络爬虫 LeanCloud数据存储 移动开发 双语阅读
下载PDF
网络爬虫的设计与实现 被引量:10
3
作者 董日壮 郭曙超 《电脑知识与技术(过刊)》 2014年第6X期3986-3988,4012,共4页
随着社会的飞速发展,互联网上信息容量急剧增加,人们对搜索引擎的依赖愈发强烈。网络爬虫是搜索引擎的关键技术之一,同时也是快速获取网络上可用资源的有效工具。为了能够对网络爬虫更深入的了解并熟练合理的应用于各种的应用和系统中,... 随着社会的飞速发展,互联网上信息容量急剧增加,人们对搜索引擎的依赖愈发强烈。网络爬虫是搜索引擎的关键技术之一,同时也是快速获取网络上可用资源的有效工具。为了能够对网络爬虫更深入的了解并熟练合理的应用于各种的应用和系统中,经过对网络爬虫的框架、基本工作流程、抓取策略的分析和了解,使用Java与HTML解析工具jsoup以及MySQL数据库实现一个网络爬虫,简单爬取京东的图书数据,用于用户喜好的分析及购买倾向的判断,为用户提供个性化的服务。 展开更多
关键词 搜索引擎 网络爬虫 抓取策略 JAVA jsoup MYSQL
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部