-
题名大数据时代下基于Python的网络信息爬取技术
被引量:13
- 1
-
-
作者
刘顺程
岳思颖
-
机构
重庆邮电大学软件工程学院
-
出处
《电子技术与软件工程》
2017年第21期160-160,共1页
-
文摘
在大数据时代下,各行各业都需要大量数据的支持,如果所有数据都经过人工搜索、分析、提炼,则会大大增加工作难度。基于Python的网络信息爬取技术可以自动完成网络数据的收集、解析、格式化存储,从而提升工作效率。本文以网络信息爬取技术为研究重点,分别介绍网络爬虫的基础架构与运行流程,以及基于Python的网络爬取技术实现。
-
关键词
网络爬虫
PYTHON
大数据
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名基于背包问题与贪心算法的高效数据整合系统
- 2
-
-
作者
刘顺程
岳思颖
李楠键
-
机构
重庆邮电大学软件工程学院
-
出处
《网络安全技术与应用》
2018年第5期25-25,30,共2页
-
文摘
随着互联网+时代的到来,各行各业为使其业务更易于管理,纷纷将数据以及结构化报表通过计算机进行动态生成;这使得如何高效处理数据并生成结构化体系成为了当务之急,比如生成线上考试试卷、商品的规格参数列表、公司流程报表等。本文以高效数据整合算法为研究重点,分别介绍了传统数据整合的方法与缺陷,同时重点介绍了基于背包问题与贪心算法的高效数据整合算法——一种更高效安全的数据整合框架。
-
关键词
背包问题
贪心算法
数据整合
容器组件
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-