摘要
为了进一步提升大数据技术对油田数据分析预测结果的准确性,研究一种具有针对性的数据清洗方法,提高数据质量。通过对油田数据进行相关性分析,并结合以往业务资料进行筛选和补充,剔除无关和低关联数据项,移除空值和噪声数据,填充缺失数据。原本结构松散、空值多、异常值多的油田数据,在数据清洗后得到相关性强,无缺失值、重复值,无噪声数据,格式统一的优质数据样本,能更好地应用于之后的大数据模型计算。对数据进行针对性的数据清洗,提高数据质量,是提升大数据分析的准确性的重要前提。
出处
《电脑知识与技术》
2023年第3期86-88,共3页
Computer Knowledge and Technology