随着前兆观测数据的激增,如何对大量的观测数据中存在的异常数据进行快速检测,是当前面临的比较迫切的问题。本文利用一种基于快速聚类的异常数据检测与评价方法,解决大量观测数据中异常数据的自动检测问题。首先,利用垂直距离分段方法...随着前兆观测数据的激增,如何对大量的观测数据中存在的异常数据进行快速检测,是当前面临的比较迫切的问题。本文利用一种基于快速聚类的异常数据检测与评价方法,解决大量观测数据中异常数据的自动检测问题。首先,利用垂直距离分段方法对水管倾斜仪观测数据进行分割,构造分段数据对象;其次,利用均值、方差、峰度与偏度等特征对分段数据对象进行特征表达;然后,基于反正切函数改进影响蚁群算法聚类效率的路径持久性参数,利用快速搜索算法(Clustering by Fast Search,CFS)和改进的蚁群最优化算法(Ant Colony Optimization,ACO)分别对分段数据对象进行聚类,实现对观测数据中异常数据检测的目的;最后,利用F-measure、R-value指标与Chi-square检验评估CFS和ACO聚类方法在异常数据检测上的有效性,以上检测方法都通过了三种指标的有效性检验。实验结果表明ACO和CFS聚类算法可以有效、快速地检测到观测数据中的局部异常数据,诸如高频变化、尖峰等异常数据,为形变类观测数据中异常数据的识别提供一种有效的检测与评价方法。展开更多
文摘随着前兆观测数据的激增,如何对大量的观测数据中存在的异常数据进行快速检测,是当前面临的比较迫切的问题。本文利用一种基于快速聚类的异常数据检测与评价方法,解决大量观测数据中异常数据的自动检测问题。首先,利用垂直距离分段方法对水管倾斜仪观测数据进行分割,构造分段数据对象;其次,利用均值、方差、峰度与偏度等特征对分段数据对象进行特征表达;然后,基于反正切函数改进影响蚁群算法聚类效率的路径持久性参数,利用快速搜索算法(Clustering by Fast Search,CFS)和改进的蚁群最优化算法(Ant Colony Optimization,ACO)分别对分段数据对象进行聚类,实现对观测数据中异常数据检测的目的;最后,利用F-measure、R-value指标与Chi-square检验评估CFS和ACO聚类方法在异常数据检测上的有效性,以上检测方法都通过了三种指标的有效性检验。实验结果表明ACO和CFS聚类算法可以有效、快速地检测到观测数据中的局部异常数据,诸如高频变化、尖峰等异常数据,为形变类观测数据中异常数据的识别提供一种有效的检测与评价方法。