摘要
以网易新闻为研究对象,基于Java技术设计实现了一个简单的新闻数据采集器,从数据库设计、ORM技术、爬虫程序、页面解析等方面进行了实践。采集器充分利用面向对象原理,以集合框架List和Set对数据以对象形式进行存取,实现了对数据库的增删改查等操作。实验结果表明,本程序可以有效地实现网页数据的快速获取,并可以在此基础上进一步为数据挖掘、新闻展示等应用提供数据源。
出处
《电脑编程技巧与维护》
2019年第4期21-23,37,共4页
Computer Programming Skills & Maintenance
基金
2018年江苏省教育科学规划项目"教育大数据背景下混合式学习的研究与实践"(C-b/2018/03/07)
2018年江苏省苏州市职业大学教改项目"基于React Native的新闻原生App设计"(SZDYKC-180608)