期刊文献+
共找到405篇文章
< 1 2 21 >
每页显示 20 50 100
Outlier Detection Algorithm Based on Iterative Clustering
1
作者 古平 罗辛 +1 位作者 杨瑞龙 张程 《Journal of Donghua University(English Edition)》 EI CAS 2015年第4期554-558,共5页
A novel approach for outlier detection with iterative clustering( ICOD) in diverse subspaces is proposed. The proposed methodology comprises two phases,iterative clustering and outlier factor computation. During the c... A novel approach for outlier detection with iterative clustering( ICOD) in diverse subspaces is proposed. The proposed methodology comprises two phases,iterative clustering and outlier factor computation. During the clustering phase, multiple clusterings are detected alternatively based on an optimization procedure that incorporates terms for cluster quality and novelty relative to existing solution. Once new clusters are detected,outlier factors can be estimated from a new definition for outliers( cluster based outlier), which provides importance to the local data behavior. Experiment shows that the proposed algorithm can detect outliers which exist in different clusterings effectively even in high dimensional data sets. 展开更多
关键词 clusterING outlier detection dimensional reduction
下载PDF
Outlier detection based on multi-dimensional clustering and local density
2
作者 SHOU Zhao-yu LI Meng-ya LI Si-min 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1299-1306,共8页
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl... Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments. 展开更多
关键词 data MINING outlier DETECTION outlier DETECTION method based on MULTI-DIMENSIONAL clusterING and local density (ODBMCLD) algorithm deviation DEGREE
下载PDF
改进DPC聚类算法的离群点检测与解释方法
3
作者 周玉 夏浩 裴泽宣 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第8期68-85,共18页
为解决全局离群点检测方法无法对局部离群点进行检测,以及局部异常因子在面对大量局部离群点时性能下降的问题,利用k近邻(KNN)和核密度估计方法(KDE)提出一种基于改进快速搜索和发现密度峰值聚类算法(KDPC)的离群点检测与解释方法,该方... 为解决全局离群点检测方法无法对局部离群点进行检测,以及局部异常因子在面对大量局部离群点时性能下降的问题,利用k近邻(KNN)和核密度估计方法(KDE)提出一种基于改进快速搜索和发现密度峰值聚类算法(KDPC)的离群点检测与解释方法,该方法能够同时对数据点的全局和局部进行分析。首先,利用k近邻和核密度估计方法计算数据点的局部密度,代替传统DPC算法中根据截断距离计算的局部密度。其次,将数据点的k近邻距离之和作为全局异常值,并通过KDPC聚类算法计算簇密度以及数据点的局部异常值。最后,将数据点的全局与局部异常值进行乘积作为最终异常得分,选取异常得分最高的Top-n作为离群点,通过构建全局-局部异常值决策图对全局和局部离群点进行解释。利用人工数据集和UCI数据集进行实验并与10种常用离群点检测方法进行比较。结果表明,该方法对全局和局部离群点都有着较高的检测精度和检测性能,并且AUC方面受k值影响较小。同时,利用该方法对NBA球员数据进行分析讨论,进一步证明了该方法的实用性和有效性。 展开更多
关键词 离群点检测 聚类 密度峰值 K近邻 核密度估计
下载PDF
基于机器学习的聚类序列离群点数据挖掘算法
4
作者 王彩霞 陶健 舒升 《通化师范学院学报》 2024年第8期28-34,共7页
由于聚类序列离群点数据具有时序依赖性特征,难以精准检测离群点,导致数据挖掘效果不理想.针对该问题,提出了基于机器学习的聚类序列离群点数据挖掘算法,利用机器学习方法进行聚类序列离群点数据聚类处理,计算离群点离群指数;通过机器... 由于聚类序列离群点数据具有时序依赖性特征,难以精准检测离群点,导致数据挖掘效果不理想.针对该问题,提出了基于机器学习的聚类序列离群点数据挖掘算法,利用机器学习方法进行聚类序列离群点数据聚类处理,计算离群点离群指数;通过机器学习聚合数据,分配离群点数据;遍历数据样本特征序列,计算特征区间适用度,分析特征与目标变量之间关系;将数据分类挖掘问题转换为线性可分问题,避免出现过拟合;设计数据挖掘过程,根据记录每个数据点出现的时间戳,实现数据挖掘.实验结果表明:该算法只是在PSLG数据集与实际离群点占比出现了1%的误差,其余均一致,数据挖掘范围与标定范围一致,具有精准挖掘效果. 展开更多
关键词 机器学习 聚类序列 离群点 数据挖掘
下载PDF
基于离群点检测和自适应参数的三支DBSCAN算法
5
作者 李志聪 孙旭阳 《计算机应用研究》 CSCD 北大核心 2024年第7期1999-2004,共6页
针对经典的DBSCAN算法存在难以确定全局最优参数和误判离群点的问题,该算法首先从选择最优参数角度出发,通过数据集的分布特征生成Eps和MinPts列表,将两个列表中的参数进行全组合操作,把不同的参数组合依次进行聚类,从而寻找准确率最高... 针对经典的DBSCAN算法存在难以确定全局最优参数和误判离群点的问题,该算法首先从选择最优参数角度出发,通过数据集的分布特征生成Eps和MinPts列表,将两个列表中的参数进行全组合操作,把不同的参数组合依次进行聚类,从而寻找准确率最高点对应的参数。最后从离群点角度出发,将三支决策思想与离群点检测LOF算法进行结合。该算法与多种聚类算法进行效果对比分析,结果表明该算法能够全自动化选择全局最优参数,并提高聚类算法的准确性。 展开更多
关键词 DBSCAN算法 三支聚类 自适应参数 离群点检测
下载PDF
基于异常点检测的大学生异质行为分析
6
作者 彭琳 宋珺 +1 位作者 刘安栋 熊玲珠 《软件导刊》 2024年第4期193-198,共6页
大学生异质行为指的是大学生具有个性特征、不同于他人的行为偏好。针对大学生异质个体的行为挖掘问题,提出一种基于异常点检测的异质行为分析方法。首先以某校大学生成绩数据和校园一卡通数据为基础,建立异质行为分析模型,采用主成分... 大学生异质行为指的是大学生具有个性特征、不同于他人的行为偏好。针对大学生异质个体的行为挖掘问题,提出一种基于异常点检测的异质行为分析方法。首先以某校大学生成绩数据和校园一卡通数据为基础,建立异质行为分析模型,采用主成分分析、K-Means++和DBSCAN聚类分析寻找异常点,研究关注异常点对应的异质行为人。然后,通过异常点检测辨别学习成绩中的异质个体,并进一步探究其作息规律与学习成绩异常之间是否存在强关联。接下来,运用多种算法相互印证异常点的准确性,借助对相关学生的调研来验证异常点数据的可信度。研究表明,所提方法能对大学生异质行为模式进行深度分析,为提升学校管理水平和管理效率提供了基础依据。 展开更多
关键词 异质性 行为分析 聚类算法 主成分分析 异常点检测
下载PDF
启发式k-means聚类算法的改进研究
7
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 聚类算法 K-MEANS 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
基于异常值检测矩阵分解的服务质量预测
8
作者 张园园 朵琳 韦贵香 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期255-264,共10页
基于Qo S感知的Web服务推荐是帮助用户找到高质量服务的解决方案之一.为了准确预测候选服务的QoS值,通常需要收集用户的历史QoS数据.然而,现有的方法大多忽略了历史数据中的异常值会导致预测准确度降低.为了解决这一问题,提出一种基于... 基于Qo S感知的Web服务推荐是帮助用户找到高质量服务的解决方案之一.为了准确预测候选服务的QoS值,通常需要收集用户的历史QoS数据.然而,现有的方法大多忽略了历史数据中的异常值会导致预测准确度降低.为了解决这一问题,提出一种基于异常值检测矩阵分解的服务质量预测方法.首先,使用基于K-means的隔离森林算法先对历史QoS数据进行聚类,将历史数据中的异常值剔除;然后,将其用于改进的矩阵分解模型中对未知值进行预测;最后,利用柯西损失来评估观察值与预测值之间的差异.实验采用WSDream数据集进行测试,结果表明,提出的异常值检测模型的响应时间的MAE与RMSE指标平均提高了19.11%和39.59%,吞吐量的MAE与RMSE指标平均提高了9.82%和29.89%,证明所提模型有效改进了预测准确度. 展开更多
关键词 K-MEANS聚类 异常值检测 矩阵分解 柯西损失 服务质量
下载PDF
融合异常检测与区域分割的高效K-means聚类算法
9
作者 尹宏伟 杭雨晴 胡文军 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期80-88,共9页
传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,... 传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,以提高聚类性能。其次,利用近邻簇搜索技术对各类簇进行自适应的区域分割,以减少冗余计算,提高算法执行效率。最后,为验证所提方法的有效性,在多个合成数据集和真实数据集上分别进行测试。实验结果表明:所提算法聚类性能和执行效率优于其他算法;在添加10%异常样本的Wine数据集上准确度可达0.911。 展开更多
关键词 聚类 K-MEANS 异常检测 区域分割 近邻簇搜索 自适应
下载PDF
基于放电曲线多特征值和组合聚类算法的液态金属电池筛选研究
10
作者 张娥 樊磊 +5 位作者 徐成 王晟 李浩秒 蒋凯 李波 王康丽 《中国电机工程学报》 EI CSCD 北大核心 2024年第20期8073-8085,I0013,共14页
高效的电池筛选技术是保障储能电池系统安全性、经济性的关键技术之一。为了满足液态金属电池储能系统构建对单体一致性的要求,提出一种组合聚类方法,通过电池恒流放电期间获得的分选指标进行有效聚类,快速实现液态金属电池筛选。首先,... 高效的电池筛选技术是保障储能电池系统安全性、经济性的关键技术之一。为了满足液态金属电池储能系统构建对单体一致性的要求,提出一种组合聚类方法,通过电池恒流放电期间获得的分选指标进行有效聚类,快速实现液态金属电池筛选。首先,提出一种特征提取框架来准确表征电池放电曲线,主要包括数据采集、数据预处理、特征参数生成、筛选指标生成4个阶段,生成的3个筛选指标,分别是电池曲线第2个拐点电压、对应的时间以及电池在第1个拐点电压前的放电能量。然后,提出基于密度的噪声应用空间聚类和均值漂移的组合聚类电池筛选方法,并提出一种一致性差异指标量化评估聚类效果。最后,通过分析212个200 Ah级液态金属电池的聚类优化效果可知,所提方法可显著减弱差异性较大电池对电池筛选的影响,能够同时实现离群值检测及电池自适应快速精准筛选,并通过动态工况测试证实所提方法可有效提升电池组响应一致性。 展开更多
关键词 电池筛选 液态金属电池 特征提取 组合聚类方法 离群值处理
下载PDF
基于改进K-means聚类算法的网络异常数据挖掘与分类方法
11
作者 贺萌 《无线互联科技》 2024年第18期119-122,共4页
为了解决网络异常数据挖掘过程中漏报率、误报率较高的问题,文章提出一种基于改进K-means聚类算法的网络异常数据挖掘与分类方法。文章通过构建并行化频繁项集挖掘环境加速数据处理,利用局部离群点检测剔除异常值,同时引入K-means聚类... 为了解决网络异常数据挖掘过程中漏报率、误报率较高的问题,文章提出一种基于改进K-means聚类算法的网络异常数据挖掘与分类方法。文章通过构建并行化频繁项集挖掘环境加速数据处理,利用局部离群点检测剔除异常值,同时引入K-means聚类对数据的最大最小距离展开计算,融合隶属度函数与密度峰值优化算法,改进聚类初始中心选择及簇边界调整,从而提高异常识别准确性和分类效率。通过实验结果证明,该方法能够明显改善聚类效果与性能。 展开更多
关键词 K-MEANS聚类算法 网络异常 数据挖掘 数据分类 离群点检测
下载PDF
基于无监督学习的异质网络多尺度离群点挖掘研究
12
作者 朱辉 张莉芸 《现代电子技术》 北大核心 2024年第12期182-186,共5页
现有的异质网络多尺度离群点挖掘算法忽略了数据点之间的顺序关系,无法充分利用数据点在异质网络中的排列顺序信息,从而导致聚类精度下降。对此,提出一种基于无监督学习的异质网络多尺度离群点挖掘方法,对异质网络的多节点、多边特点进... 现有的异质网络多尺度离群点挖掘算法忽略了数据点之间的顺序关系,无法充分利用数据点在异质网络中的排列顺序信息,从而导致聚类精度下降。对此,提出一种基于无监督学习的异质网络多尺度离群点挖掘方法,对异质网络的多节点、多边特点进行分析。利用季节-趋势时序分解法提取异质网络数据特征。根据数据特征,结合K-means聚类算法与排序算法,将数据点的排序信息添加至聚类过程中,以实现对异质网络数据离群点的挖掘。实验结果表明,利用该方法进行网络数据节点聚类的准确率均能达到80%以上;并且实现了多尺度离群点挖掘后,能够精准地识别出离群点,为后续的网络通信维护提供了良好的保障。 展开更多
关键词 异质网络 多尺度 离群点挖掘 无监督学习 K均值聚类 网络数据 离群因子
下载PDF
PBX9502冲击Hugoniot曲线的参数标定和不确定度量化
13
作者 梁霄 张培红 +1 位作者 王瑞利 陈江涛 《弹道学报》 CSCD 北大核心 2024年第1期104-110,共7页
冲击Hugoniot试验不可避免地受到不确定因素的扰动,冲击Hugoniot关系的参数标定和不确定度量化对理解爆轰多物理过程的动力行为极为关键。首先,收集Los Alamos实验室的粒子速度-冲击波速度试验数据,通过不确定度传递律计算冲击波速度的... 冲击Hugoniot试验不可避免地受到不确定因素的扰动,冲击Hugoniot关系的参数标定和不确定度量化对理解爆轰多物理过程的动力行为极为关键。首先,收集Los Alamos实验室的粒子速度-冲击波速度试验数据,通过不确定度传递律计算冲击波速度的标准不确定度,结果表明不能仅仅依靠绝对偏差的大小来判断异常值。采用基于绝对偏差距离的自适应聚类异常值检测法,剔除试验数据中的异常干扰点。其次,针对清洗后的试验数据,利用最小二乘回归方法拟合粒子速度-冲击波速度的冲击Hugoniot关系,并利用统计理论推导出Hugoniot参数的不确定度。进而,使用国内试验装置和试验数据,通过建立合适的误差公式,将Hugoniot曲线的预测值与试验值做比对,预测结果与试验结果吻合良好。结果还表明:清洗后的Hugoniot关系能更准确地预测PBX9502的冲击动力行为,确认标定参数的有效性。最后,将Chapman-Jouguet理论结合合理的假设和近似,给出了基于Hugoniot关系爆压的计算公式,给出了爆压的不确定度量化。研究结果能为发展强预测能力、高可信度软件提供保证。 展开更多
关键词 异常值检测 冲击Hugoniot关系 自适应聚类 不确定度量化 参数标定 Chapman-Jouguet理论
下载PDF
船用开关柜局部放电异常检测
14
作者 李浩 陈亚杰 杨帆 《机电设备》 2024年第2期35-41,共7页
针对船用开关柜现场带电检测数据,提出了一种基于多维特征量的主成分(PCA)聚类离群算法,对柜体的局部放电程度进行异常识别。首先采用运行时间的年限系数以及局部放电检测数据的离散度、均值距离度和极差度等指标全面量化开关柜局部放... 针对船用开关柜现场带电检测数据,提出了一种基于多维特征量的主成分(PCA)聚类离群算法,对柜体的局部放电程度进行异常识别。首先采用运行时间的年限系数以及局部放电检测数据的离散度、均值距离度和极差度等指标全面量化开关柜局部放电状态程度,构建PCA-多维样本数据集;通过轮廓系数法选择聚类离群算法最佳的簇参数;考虑聚类后各类别之间的密度差异性,引入相对距离量化局部放电的程度,由此实现局放程度异常识别。对现场带电检测实际数据进行实例分析,验证该方法的可行性,为船用开关柜的局部放电状态异常识别提供一定的理论依据。 展开更多
关键词 开关柜 PCA-多维样本 轮廓系数 相对距离 聚类离群
下载PDF
基于时空聚类和深度学习的混凝土坝变形异常值识别方法
15
作者 宋锦焘 葛佳豪 +3 位作者 杨杰 徐笑颜 陈家敏 孟庆耀 《水利水电科技进展》 CSCD 北大核心 2024年第4期65-71,共7页
针对传统大坝异常值识别方法多依靠单测点模型,未充分考虑测点间变形的时空关联特性,易造成异常值误诊断的问题,提出了基于时空聚类和深度学习的混凝土坝变形异常值识别方法。该方法利用测点间变形的时空关联特性对混凝土坝测点变形数... 针对传统大坝异常值识别方法多依靠单测点模型,未充分考虑测点间变形的时空关联特性,易造成异常值误诊断的问题,提出了基于时空聚类和深度学习的混凝土坝变形异常值识别方法。该方法利用测点间变形的时空关联特性对混凝土坝测点变形数据进行时空聚类分区,基于新型蜜獾优化算法(HBA)与双向长短时记忆(BiLSTM)神经网络构建HBA-BiLSTM变形预测模型,根据模型输出的变形值以及异常值判别指标识别混凝土坝变形异常值。实例验证结果表明,该方法比传统异常值识别方法准确率更高。 展开更多
关键词 混凝土坝 变形 异常值识别 监控模型 时空聚类
下载PDF
基于VMD和改进聚类算法的配电网故障选线方法 被引量:1
16
作者 王远川 李泽文 +2 位作者 夏翊翔 毛紫玲 郭欣玉 《电力系统及其自动化学报》 CSCD 北大核心 2024年第4期9-18,共10页
为提高小电流接地系统单相接地故障的选线准确率,设计了一种基于调幅调频函数的变分模态分解VMD(variational mode decomposition)与K-means++聚类算法相结合的故障选线方案。对故障发生后各条线路零序电流信号进行VMD分解,得到多个自... 为提高小电流接地系统单相接地故障的选线准确率,设计了一种基于调幅调频函数的变分模态分解VMD(variational mode decomposition)与K-means++聚类算法相结合的故障选线方案。对故障发生后各条线路零序电流信号进行VMD分解,得到多个自适应频带特征的本征模态函数;构造以低频分量的波形相关系数为横坐标和以高频分量初始极性为纵坐标的二维平面,在该二维平面绘制代表各出线的散点分布图;最后通过K-means++聚类算法对所构造的散点点集进行聚类分析,利用代表故障线路的散点属于离群点的特点,筛选出故障线路。通过Pscad软件进行仿真验证,结果表明,该故障选线方法不受条件改变的影响,能够实现对故障线路的准确识别,具有较好的抗噪能力。 展开更多
关键词 故障选线 变分模态分解 聚类算法 小电流接地系统 离群点
下载PDF
一种基于DBSCAN算法改进的稳健AdaBoost回归模型
17
作者 黄静 杨联强 《合肥学院学报(综合版)》 2024年第2期1-9,共9页
传统的AdaBoost.R2算法在AdaBoost算法思想的基础上将回归问题转化为二分类问题,取得了较好的估计效果。但该算法对异常点敏感,在迭代过程中会将异常点的权重不断加大,导致模型的稳健性较差。提出一种改进的AdaBoost算法,称为AdaBoost.D... 传统的AdaBoost.R2算法在AdaBoost算法思想的基础上将回归问题转化为二分类问题,取得了较好的估计效果。但该算法对异常点敏感,在迭代过程中会将异常点的权重不断加大,导致模型的稳健性较差。提出一种改进的AdaBoost算法,称为AdaBoost.DBSCAN。首先,通过DBSCAN聚类算法对观测点进行分类;然后,分别针对正常点和异常点,采用不同的权重控制策略进行控制,保证异常点的权重在迭代过程中无法以指数速率增长,同时能较大程度地保存样本信息。模拟和实际应用结果表示,与传统的AdaBoost.R2、AdaBoost.RT算法以及AdaBoost.RS算法相比,该算法具有良好的稳健性,在含有不同比例异常点的数据集中都能够获得较好的表现。 展开更多
关键词 AdaBoost.R2 DBSCAN聚类算法 异常点 稳健性 回归
下载PDF
基于自适应密度聚类的多准则主动学习方法
18
作者 贺忠海 朱温涵 +1 位作者 陈旭旺 张晓芳 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第3期179-187,共9页
主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返... 主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返回样本的信息性.针对上述问题,本文提出了一种基于自适应密度聚类的高斯过程回归(ADC-GPR)算法,通过先聚类后直接利用不确定性进而高效选择样本。该算法中的ADC聚类不仅对离群点鲁棒,还能根据数据集分布特性自适应聚类,并为后续的AL提供了代表性样本点和其对应的簇,该方法在无监督选择时保证了代表性和多样性,在有监督选择时考虑了信息性、代表性和多样性。实验结果表明,在相同的抽样次数下将ADC-GPR算法与RS、KS以及RD-GPR算法相比,其平均性能分别提升了37.3%、8%和2.8%,ADC-GPR算法的选择效率更高。 展开更多
关键词 主动学习 自适应密度聚类 高斯过程回归 离群点鲁棒 多标准融合
下载PDF
全局搜索密度峰值聚类中心的线性回归方法研究
19
作者 马翔 《计算机与数字工程》 2024年第5期1353-1358,共6页
针对在数据量大且分布不均匀时非线性拟合效果不佳且易受离群点影响的问题,提出一种全局搜索密度峰值聚类中心的线性回归方法,采用密度峰值聚类方法根据样本分布密度将所有数据点划分为多个类簇,引入DKC值和AM度量降低离群点对聚类中心... 针对在数据量大且分布不均匀时非线性拟合效果不佳且易受离群点影响的问题,提出一种全局搜索密度峰值聚类中心的线性回归方法,采用密度峰值聚类方法根据样本分布密度将所有数据点划分为多个类簇,引入DKC值和AM度量降低离群点对聚类中心选取的影响,将聚类中心作为拟合的特征点进行分段线性拟合。通过对航班油耗的分段线性拟合的实验验证了该方法在此类拟合问题中的有效性,为线性回归分析提供了一种新思路。 展开更多
关键词 密度峰值聚类 离群点 DKC值 AM度量 线性回归
下载PDF
基于局部离群因子的电力计量数据异常值自动化监测系统
20
作者 李宗朋 苏良立 +1 位作者 赖鸿波 张婉 《自动化与仪表》 2024年第11期137-140,共4页
针对电力计量数据异常导致的电力系统故障,提出基于局部离群因子的电力计量数据异常值自动化监测系统。该系统集成多传感器采集数据,通过通信模块传输至处理模块。该模块先运用AP聚类算法将数据聚类成多个类簇,再使用局部离群因子模型... 针对电力计量数据异常导致的电力系统故障,提出基于局部离群因子的电力计量数据异常值自动化监测系统。该系统集成多传感器采集数据,通过通信模块传输至处理模块。该模块先运用AP聚类算法将数据聚类成多个类簇,再使用局部离群因子模型计算离群度,通过离群度数值得到异常类簇,则该异常类簇为异常值,再将监测结果传输到用户PC端,实现电力计量数据异常值自动化监测。实验结果表明,该系统聚类电力计量数据时的疏密度数值较高,可有效检测异常值,应用性能较为显著。 展开更多
关键词 局部离群因子 电力计量数据 异常值 自动化监测 AP聚类算法 离群度
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部