-
题名基于相关性分析的工业时序数据异常检测
被引量:45
- 1
-
-
作者
丁小欧
于晟健
王沐贤
王宏志
高宏
杨东华
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第3期726-747,共22页
-
基金
国家重点研发计划(2016YFB100703)
国家自然科学基金(U1509216,U1866602,61602129)
CCF-华为数据库创新研究计划(CCF-Huawei DBIR2019005B)。
-
文摘
多维时间序列上的异常检测,是时态数据分析的重要研究问题之一.近年来,工业互联网中传感器设备采集并积累了大量工业时间序列数据,这些数据具有模式多样、工况多变的特性,给异常检测方法的效率、效果和可靠性均提出更高要求.序列间相互影响、关联,其隐藏的相关性信息可以用于识别、解释异常问题.基于此,提出一种基于序列相关性分析的多维时间序列异常检测方法.首先对多维时间序列进行分段、标准化计算,得到相关性矩阵,提取量化的相关关系;然后建立了时序相关图模型,通过在时序相关图上的相关性强度划分时间序列团,进行时间序列团内、团间以及单维的异常检测.在真实的工业设备传感器数据集上进行了大量实验,实验结果验证了该方法在高维时序数据的异常检测任务上的有效性.通过对比实验,验证了该方法从性能上优于基于统计和基于机器学习模型的基准算法.该研究通过对高维时序数据相关性知识的挖掘,既节约了计算成本,又实现了对复杂模式的异常数据的精准识别.
-
关键词
异常检测
多维时间序列
时序数据分析
工业大数据
机器学习
-
Keywords
anomaly detection
multi-dimensional time series
temporal data analysis
industrial big data
machine learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名工业时序大数据质量管理
被引量:10
- 2
-
-
作者
丁小欧
王宏志
于晟健
-
机构
哈尔滨工业大学海量数据计算研究中心
-
出处
《大数据》
2019年第6期19-29,共11页
-
基金
国家重点研发计划基金资助项目(No.2018YFB1004700)
国家自然科学基金资助项目(No.U1509216,No.U1866602,No.61602129)~~
-
文摘
工业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中一种重要的数据形式,存在大量的数据质量问题,需要设计数据清洗方法对其进行检测和有效处理。介绍了工业时序大数据的特点及工业数据质量管理的难点,并对工业时序大数据质量管理的研究现状加以分析、总结,最后,提出了时序大数据质量管理方法和系统性能的提升方向。
-
关键词
数据质量管理
时序数据
工业大数据分析
数据清洗
-
Keywords
data quality management
rime series data
industrial big data analysis
data cleaning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-