-
题名基于聚类分析法的织造车间能耗数据清洗
- 1
-
-
作者
黄启航
汝欣
戴宁
俞博
陈炜
徐郁山
-
机构
浙江理工大学机械工程学院
浙江天衡信息技术有限公司
浙江康立自控科技有限公司
-
出处
《软件工程》
2024年第7期22-27,共6页
-
基金
浙江省科技计划项目(2022C01202)。
-
文摘
针对织造车间数据采集过程中存在的数据质量低、数据冗余高的问题,提出了一种基于聚类分析法的综合数据清洗方法。首先,对纺织企业车间能耗进行层级分析,针对异常数据提出了基于二分K-means算法的异常数据识别方法。其次,针对缺失数据,采用多样化数据插补办法,实现对不同特征数据的插补;针对数据冗余高的问题,引入可决系数对数据集进行去重,降低数据集冗余。最后,以某纺织企业车间运行数据为对象进行仿真实验,结果表明,经降重后,数据集的数据量降低了83%,数据集预测实验的平均绝对百分比误差波动范围小于2%,该方法在降低数据冗余的同时保证了预测的可靠性。
-
关键词
数据清洗
聚类
异常检测
去重
-
Keywords
data cleaning
clustering
abnormal detection
deduplication
-
分类号
TP111.8
[自动化与计算机技术—控制理论与控制工程]
-