摘要
文章主要研究针对农产品数据的预处理过程。由于数据的来源比较复杂,所以收集上来的数据难免出现缺失、重复或者模糊的内容,这些数据都需要被清洗或转换。另外,要实现对农产品分布、特征以及价格趋势的分析研究,就要对这些数据进行合并、转化、缩放、离散化等处理。研究以Python作为开发语言,以Pandas为数据分析工具从合并数据、清洗数据、标准化数据、转换数据四个方面来探讨农产品数据的预处理工作,最终达到提升数据质量、降低数据分析成本的目的。
出处
《电脑知识与技术》
2023年第30期55-58,共4页
Computer Knowledge and Technology
基金
广西壮族自治区教育厅广西高校中青年教师科研基础能力提升项目资助(No.2021KY0709)
广西壮族自治区教育厅广西高校中青年教师科研基础能力提升项目资助(No.2023KY0736)。