由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identi...由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identify the clustering structure)算法完成,确定待检测离群点所需参数,计算出离群点的离群属性,根据离群属性计算结果,引入邻域密度构建离群点快速检测模型,设定模型中离群点检测阈值,实现不确定数据集中离群点的快速检测。由仿真结果得出,与传统检测方法相比,提出的方法算法运行耗时降低了50%以上,离群点的判定准确度更高,漏检、误检率大大降低,实现了离群点精度高、速度快的检测,对数据挖掘与预处理有显著的实践意义。展开更多
文摘由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identify the clustering structure)算法完成,确定待检测离群点所需参数,计算出离群点的离群属性,根据离群属性计算结果,引入邻域密度构建离群点快速检测模型,设定模型中离群点检测阈值,实现不确定数据集中离群点的快速检测。由仿真结果得出,与传统检测方法相比,提出的方法算法运行耗时降低了50%以上,离群点的判定准确度更高,漏检、误检率大大降低,实现了离群点精度高、速度快的检测,对数据挖掘与预处理有显著的实践意义。