-
题名基于Python的大数据文档拆分规律研究
被引量:1
- 1
-
-
作者
丁思蓉
何静茹
李真
-
机构
成都锦城学院
-
出处
《现代信息科技》
2022年第6期107-109,共3页
-
文摘
拆分大数据文档是日常生活中所需的,随着大数据文档的增加,选择拆分行数是一个值得研究的问题。运用PyCharm Community和Python来拆分大文档,对比分析在不同行数的条件下,大文档拆分成小文档所用的数量以及时间。报告了拆分数量适中是最佳的,文档数据量越大,消耗的时间越不稳定。通过对同一文档拆分最短时间的拆分行数进行研究,得到拆分时间规律,选择最佳的拆分行数,以此提高拆分文档效率。
-
关键词
拆分大数据文档
对比分析
拆分行数
-
Keywords
splitting big data document
comparative analysis
the number of splitting rows
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-