-
题名基于改进GMM算法的综合能源数据清洗研究
被引量:2
- 1
-
-
作者
杨柳林
胡贺骏
-
机构
广西大学电气工程学院
-
出处
《电子测量技术》
北大核心
2023年第4期78-83,共6页
-
文摘
针对数据中台在采集数据过程中会产生异常值的问题,提出一种改进GMM算法的数据清洗方法。首先,将边缘计算引入来解决负载过大的问题;其次,为避免EM算法计算参数时陷入局部最优解,通过对GMM算法中的参数进行优化,改善了陷入局部最优解的缺点。实验结果表明,一定的数据量下,改进的GMM算法在召回率、F值等指标上均优于GMM-EM算法。由此可知,改进算法在一定程度上提高了对异常数据的清洗效果,保证数据的可靠性。
-
关键词
综合能源
数据中台
数据清洗
高斯混合模型
粒子群算法
-
Keywords
integrated energy
data platform
data cleaning
gaussian mixture model
PSO algorithm
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名城镇居民能耗数据平台设计与实现
- 2
-
-
作者
黄升平
徐秀峰
胡贺骏
李雪玲
郑立思
-
机构
广西电网有限责任公司崇左供电局
广西大学
广西康耐肯特科技有限公司
-
出处
《微型电脑应用》
2023年第11期208-212,共5页
-
文摘
电、水、气等行业存在信息无法共享、抄表、漏损等难题,并且具有数据异构、海量等特点,如何应对数据的集中治理和清洗是面临的挑战之一。文章基于非关系型数据库设计了一种多源数据平台,提出的数据平台包括数据传输、数据治理和数据发布,并研究了异构数据融合、批处理计算能力、高可用性、平台安全与可靠性四方面的关键技术。在实际工程应用中,通过对复杂数据的有效处理,验证了所设计的数据平台可以支持实际应用中的功能要求。
-
关键词
数据平台
异构数据
数据清洗
-
Keywords
data platform
heterogeneous data
data cleaning
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-