期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于聚类分析法的织造车间能耗数据清洗
1
作者 黄启航 汝欣 +3 位作者 戴宁 俞博 陈炜 徐郁山 《软件工程》 2024年第7期22-27,共6页
针对织造车间数据采集过程中存在的数据质量低、数据冗余高的问题,提出了一种基于聚类分析法的综合数据清洗方法。首先,对纺织企业车间能耗进行层级分析,针对异常数据提出了基于二分K-means算法的异常数据识别方法。其次,针对缺失数据,... 针对织造车间数据采集过程中存在的数据质量低、数据冗余高的问题,提出了一种基于聚类分析法的综合数据清洗方法。首先,对纺织企业车间能耗进行层级分析,针对异常数据提出了基于二分K-means算法的异常数据识别方法。其次,针对缺失数据,采用多样化数据插补办法,实现对不同特征数据的插补;针对数据冗余高的问题,引入可决系数对数据集进行去重,降低数据集冗余。最后,以某纺织企业车间运行数据为对象进行仿真实验,结果表明,经降重后,数据集的数据量降低了83%,数据集预测实验的平均绝对百分比误差波动范围小于2%,该方法在降低数据冗余的同时保证了预测的可靠性。 展开更多
关键词 数据清洗 聚类 异常检测 去重
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部