期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
椭球约束线性模型异常点的Score检验
1
作者 李俊 《铜仁学院学报》 2008年第4期137-140,144,共5页
利用方差扩大模型,获得椭球约束线性模型异常点的Score检验函数。最后,通过经典的实验数据对本文结果进行实例分析。
关键词 椭球约束线性模型 异常点 方差扩大模型 score检验
下载PDF
ECOD算法在飞机不稳定进近检测中的应用
2
作者 卢晓光 许忠睿 +1 位作者 张喆 文贵宏 《安全与环境学报》 CAS CSCD 北大核心 2024年第5期1872-1878,共7页
在飞机进近和着陆阶段,一旦发生不稳定进近就可能导致航空事故发生,因此终端空域内不稳定进近检测是航空器运行监控领域的热点研究问题。针对终端区的不稳定进近检测,利用OpenSky提供的开源航空器监视数据提出了基于数据驱动的检测方法... 在飞机进近和着陆阶段,一旦发生不稳定进近就可能导致航空事故发生,因此终端空域内不稳定进近检测是航空器运行监控领域的热点研究问题。针对终端区的不稳定进近检测,利用OpenSky提供的开源航空器监视数据提出了基于数据驱动的检测方法。从能量管理的角度入手,构建基于无监督异常检测(Empirical-Cumulative-Distribution-based Outlier Detection,ECOD)算法的不稳定进近检测模型,并结合主成分分析(Principal Components Analysis,PCA),获取了飞机能量状态的异常评分进而实现检测。复飞事件检测的验证分析结果表明检测模型在准确率与效率方面具有优势,模型可实现实时部署与在线更新。 展开更多
关键词 安全工程 飞行安全 不稳定进近 数据驱动 无监督异常检测(ECOD) 异常评分
下载PDF
基于节点评估与最大类间方差的孤立森林异常值检测
3
作者 严爱军 和世潇 汤健 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1188-1197,共10页
针对孤立森林(isolation forest, iForest)无法有效检测局部异常值且异常值分数阈值难以精确设定的问题,提出一种基于节点评估(node evaluation, NE)与最大类间方差(Otsu)的iForest异常值检测方法。首先,在样本评估过程中将节点深度与... 针对孤立森林(isolation forest, iForest)无法有效检测局部异常值且异常值分数阈值难以精确设定的问题,提出一种基于节点评估(node evaluation, NE)与最大类间方差(Otsu)的iForest异常值检测方法。首先,在样本评估过程中将节点深度与相对质量同时引入评分机制,使算法对全局和局部异常值敏感;然后,为了准确设定分数阈值,采用Otsu自适应设定异常值分数阈值;最后,在不同数据集上验证所提方法的有效性。实验结果表明,该方法可以有效兼顾全局和局部异常值的检测,提高iForest检测异常值的准确性。 展开更多
关键词 孤立森林(isolation forest iForest) 异常值检测 最大类间方差(Otsu) 节点评估(node evaluation NE) 分数阈值 节点深度
下载PDF
平衡单向分类随机效应模型中的多个异常值检验 被引量:4
4
作者 石磊 何利平 黄梅 《数学物理学报(A辑)》 CSCD 北大核心 2007年第3期476-487,共12页
该文研究平衡单向分类随机效应模型中多个异常值的检验问题,在基于随机效应上的均值滑动模型下导出了似然比检验统计量,并给出了其精确分布及水平异常值的检验过程。在基于观测误差上的均值滑动模型下,利用得分检验统计量给出了多个异... 该文研究平衡单向分类随机效应模型中多个异常值的检验问题,在基于随机效应上的均值滑动模型下导出了似然比检验统计量,并给出了其精确分布及水平异常值的检验过程。在基于观测误差上的均值滑动模型下,利用得分检验统计量给出了多个异常值的检验过程。 展开更多
关键词 平衡单向分类随机效应模型 多个异常值 检验 得分统计量
下载PDF
一种时序数据的离群数据挖掘新方法及其应用 被引量:1
5
作者 汤光华 王俐莉 +1 位作者 刘常昱 卢秋珍 《计算机工程与应用》 CSCD 北大核心 2006年第8期209-211,共3页
在许多数据挖掘应用中,例外情况或者离群点的监测比常规知识的发现更有意义。文章在自回归AR(p)模型和统计诊断的基础上,建立了一种时序数据的离群点检测模型。并将该模型的应用于海表水温的预测,建立海表水温的时间序列预测模型,动态... 在许多数据挖掘应用中,例外情况或者离群点的监测比常规知识的发现更有意义。文章在自回归AR(p)模型和统计诊断的基础上,建立了一种时序数据的离群点检测模型。并将该模型的应用于海表水温的预测,建立海表水温的时间序列预测模型,动态地掌握海洋的变化规律,并且利用该模型可以得到海表水温的异常之处,从而为厄尔尼诺年的预测提供了良好的方法。实验结果表明AR模型及相应的score检验可以较好地用于时序数据的离群数据挖掘问题。 展开更多
关键词 离群点 AR模型 score检验
下载PDF
基于距离的异常数据挖掘算法及其应用 被引量:12
6
作者 赵泽茂 何坤金 胡友进 《计算机应用与软件》 CSCD 北大核心 2005年第9期105-107,共3页
给出了基于距离的异常数据的数量化定义,提出了基于距离的多指标的异常数据挖掘算法,这种算法适合于一般的海量数据库中的数据分析,以学生考试成绩作为实例进行了分析,可以从中动态地挖掘异常数据。作为特例,把单指标的异常数据挖掘算... 给出了基于距离的异常数据的数量化定义,提出了基于距离的多指标的异常数据挖掘算法,这种算法适合于一般的海量数据库中的数据分析,以学生考试成绩作为实例进行了分析,可以从中动态地挖掘异常数据。作为特例,把单指标的异常数据挖掘算法应用于校园网Web服务器日志文件,给出了上网用户的频率分析图。 展开更多
关键词 异常数据挖掘 WEB日志 学生成绩 上网行为模式 数据挖掘算法 异常数据 距离 应用 WEB服务器 海量数据库
下载PDF
存在奇异值时AR模型的迭代稳健建模法 被引量:2
7
作者 龙宪惠 《四川大学学报(自然科学版)》 CAS CSCD 1992年第2期228-237,共10页
推广Abraham和Yatawara提出的检测时间序列中单个奇异值的评分检验法,用以检测AP(p)模型中多个相距大于2p+1的加性奇异值(A0).当检验到奇异值时,即用其预测值代替.用已经修改过的数据重新作阶数识别和参数估计,即可获得时间序列建模的... 推广Abraham和Yatawara提出的检测时间序列中单个奇异值的评分检验法,用以检测AP(p)模型中多个相距大于2p+1的加性奇异值(A0).当检验到奇异值时,即用其预测值代替.用已经修改过的数据重新作阶数识别和参数估计,即可获得时间序列建模的稳健性.作为时序建模的典型应用,我们将该法用于谱估计.文中给出的计算机模拟例子表明,当时序中存在奇异值使通常的时序建模法的性能急剧恶化时,采用此方法,可以恢复到没有奇异值时该方法所能达到的性能水平. 展开更多
关键词 加性奇异值 AR模型 建模 鲁棒性
下载PDF
一种基于枢纽现象和加权离群分数的离群数据挖掘算法 被引量:6
8
作者 郭峰 张继福 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2248-2253,共6页
针对高维数据集中出现的枢纽现象,本文给出了一种基于枢纽现象和加权离群分数的离群数据挖掘算法.该算法首先根据逆k近邻中出现的枢纽现象,以及与离群数据的关系,利用k近邻中的距离信息作为权值,对逆k近邻的离群分数进行加权;其次随机... 针对高维数据集中出现的枢纽现象,本文给出了一种基于枢纽现象和加权离群分数的离群数据挖掘算法.该算法首先根据逆k近邻中出现的枢纽现象,以及与离群数据的关系,利用k近邻中的距离信息作为权值,对逆k近邻的离群分数进行加权;其次随机生成区分度阈值,根据该阈值判断区分度比例满意值,并根据满意值计算数据对象的离群程度,选取离群程度最大的若干数据对象作为离群数据;最后采用人工数据集和UCI标准数据集,实验验证了该算法的有效性. 展开更多
关键词 离群挖掘 枢纽现象 逆k近邻 离群分数 满意值
下载PDF
基于半参数均值漂移模型的BDS卫星钟差异常探测与修复 被引量:9
9
作者 杨玉锋 潘雄 +2 位作者 卿晨昕 梅长松 赖祖龙 《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第8期47-54,共8页
BDS卫星钟在轨运行过程中,由于空间环境干扰及信号异常等情况,获取的钟差数据中经常会包含异常值。为了有效探测与修复异常值,提出了一种基于半参数均值漂移模型的算法处理钟差数据中的异常。首先,考虑到钟差数据中存在的系统误差,构建... BDS卫星钟在轨运行过程中,由于空间环境干扰及信号异常等情况,获取的钟差数据中经常会包含异常值。为了有效探测与修复异常值,提出了一种基于半参数均值漂移模型的算法处理钟差数据中的异常。首先,考虑到钟差数据中存在的系统误差,构建了更加符合钟差序列实际变化特点的半参数钟差模型;然后在此基础上引入了半参数均值漂移模型,利用Score统计量对该模型的假设检验进行求解,实现了异常值的定位,对异常定位后的钟差数据进行分组,进而推导出了异常值估值的表达式。最后采用国际GNSS监测评估系统的BDS精密钟差产品,进行单天和多天数据的试验分析,结果表明该算法可以自动准确的探测出钟差数据中的异常并能够精确估计出异常值的大小,异常值估值的平均误差小于0.071 ns,从而实现了适时有效地对异常历元进行修复;同时该算法处理钟差数据异常的效果优于传统MAD法,其预处理后的数据对QP钟差模型和Semi-Com钟差模型的拟合精度分别达到0.612 6和0.034 92 ns。 展开更多
关键词 卫星钟差 半参数均值漂移模型 score统计量 异常探测与修复
下载PDF
基于自适应的高对比性子空间的高维离群点检测 被引量:2
10
作者 赵保同 薛安荣 董国宾 《计算机应用研究》 CSCD 北大核心 2013年第10期2940-2943,共4页
基于子空间解决高维离群点挖掘的问题已经引起人们的广泛关注,现有方法存在的主要问题是难以选取合适的子空间且选取计算量大、阈值等参数设置困难等。这些影响了检测精度和检测效率。利用高对比度子空间选取方法解决子空间选取问题,利... 基于子空间解决高维离群点挖掘的问题已经引起人们的广泛关注,现有方法存在的主要问题是难以选取合适的子空间且选取计算量大、阈值等参数设置困难等。这些影响了检测精度和检测效率。利用高对比度子空间选取方法解决子空间选取问题,利用自适应方法解决阈值参数的确定问题,据此提出自适应的高对比性子空间离群点检测方法(AHiCS)。该方法利用统计检验算法选取高对比性子空间,在高对比性的子空间里自适应计算离群点得分,提高了离群点检测的精度与效率。理论和实验表明,该方法可以有效地挖掘高维离群点。 展开更多
关键词 高维空间 离群点检测 子空间 高对比性 自适应得分
下载PDF
基于离群点检测的学生学习状态分析方法 被引量:10
11
作者 陆柳生 余明晖 《计算机与现代化》 2016年第3期35-40,共6页
针对高校学生工作者任务繁多且直接管理的学生人数众多,难于对每个学生进行个性化的学习指导的实际问题,提出基于离群点检测的学生学习状态分析方法,将有限的教育资源分配给最迫切需求的学生。使用基于密度的局部离群点检测算法对学生... 针对高校学生工作者任务繁多且直接管理的学生人数众多,难于对每个学生进行个性化的学习指导的实际问题,提出基于离群点检测的学生学习状态分析方法,将有限的教育资源分配给最迫切需求的学生。使用基于密度的局部离群点检测算法对学生考试成绩数据进行挖掘,找出可疑离群学生,然后对可疑离群学生进行学习状态分析。案例研究结果表明,本方法能够有效地找出学习状态异常的学生,可以提升高校学生工作者的管理效率。 展开更多
关键词 离群点检测 教育数据挖掘 学生成绩 学习状态 局部离群点因子 数据挖掘
下载PDF
基于改进FCM聚类的窃电行为检测 被引量:23
12
作者 武超飞 孙冲 +4 位作者 刘厦 付文杰 陶鹏 石振刚 张林浩 《电力科学与技术学报》 CAS 北大核心 2021年第6期164-170,共7页
窃电行为检测的主要目的在于发现窃电用户,降低电力系统运营成本。在此背景下,提出基于改进模糊C均值聚类的窃电行为检测模型,包括因子分析、基于改进模糊C均值聚类的局部离群因子计算、ROC曲线模型评价与调参及最佳检测阈值选取等模块... 窃电行为检测的主要目的在于发现窃电用户,降低电力系统运营成本。在此背景下,提出基于改进模糊C均值聚类的窃电行为检测模型,包括因子分析、基于改进模糊C均值聚类的局部离群因子计算、ROC曲线模型评价与调参及最佳检测阈值选取等模块,适用于无大量已知窃电用户样本的情况。首先,通过因子分析对用户用电特征(包括用电负荷数据和电能表异常事件)进行维度规约,提升模型检测效率。再利用遗传模拟退火算法对模糊C均值聚类算法进行改进,对用户用电特征进行检测。最后与现有成熟算法进行比较,验证该模型对窃电行为具有较高的检测准确度。检测模型可输出所有被测用户用电行为离群度得分和窃电概率排序,利用该文检测模型的输出,能够以较高精度检测出窃电行为用户,根据结果进行现场稽查,可提升反窃电工作效率。 展开更多
关键词 窃电行为 异常检测 电能表异常事件 离群对象得分 无导师学习 改进模糊C均值聚类
下载PDF
浅议实验室对比数据分析方法——稳健统计Z比分数 被引量:5
13
作者 吴志清 《云南冶金》 2011年第S2期163-167,共5页
运用现代统计技术,对实验室之间的分析结果进行分析判断,区别满意、可疑、离群的数据,判定实验室的分析数据质量。
关键词 稳健统计 中位值 Z比分数 满意结果 可疑值 离群值
下载PDF
基于中心移动的轨迹离群点检测
14
作者 杨洪宁 徐文进 +1 位作者 杜珍珍 姚佳禹 《计算机系统应用》 2023年第12期189-196,共8页
AIS数据是指通过AIS系统获取的船舶运动轨迹信息,对其进行挖掘可以获得船舶的运动模式、航行路线、停靠地点等信息.但其在采集过程中产生的离群点会对聚类等任务造成负面影响,因此对AIS数据挖掘之前需要进行离群点检测.然而,当AIS轨迹... AIS数据是指通过AIS系统获取的船舶运动轨迹信息,对其进行挖掘可以获得船舶的运动模式、航行路线、停靠地点等信息.但其在采集过程中产生的离群点会对聚类等任务造成负面影响,因此对AIS数据挖掘之前需要进行离群点检测.然而,当AIS轨迹数据中存在大量离群点时,会导致大多数离群点检测算法的准确率显著下降.为了解决这个问题,本文提出了一种基于中心移动的轨迹离群点检测算法(center shift outlier detection,CSOD).通过迫使数据点向其K近邻集合的中心移动,使每个数据点更加接近典型数据,从而有效地消除了离群点对聚类的影响.为了验证本文算法的有效性,使用浙江海域AIS渔船轨迹数据集,将本文提出的CSOD算法与一些经典的离群点检测算法进行了对比实验.实验结果表明,CSOD算法整体上性能更加优越. 展开更多
关键词 AIS数据 离群点检测 聚类 K近邻 异常值得分
下载PDF
计算机网络大规模高维数据流异常数据挖掘 被引量:3
15
作者 郑湘辉 张雪冰 《黑龙江工业学院学报(综合版)》 2023年第8期105-110,共6页
研究计算机网络大规模高维数据流异常数据挖掘方法,有效挖掘计算机网络大规模高维数据流异常数据,提升计算机网络安全性。使用基于Python网络爬虫的数据采集技术采集计算机网络大规模高维数据流,经软件总线模型完成数据流清洗预处理,降... 研究计算机网络大规模高维数据流异常数据挖掘方法,有效挖掘计算机网络大规模高维数据流异常数据,提升计算机网络安全性。使用基于Python网络爬虫的数据采集技术采集计算机网络大规模高维数据流,经软件总线模型完成数据流清洗预处理,降低数据流规模与维度后,利用基于枢纽现象与加权离群分数的离群数据挖掘算法,经计算机网络数据流数据对象K近邻查询、K近邻数据对象离群分数和求解与加权、区分度阈值生成等操作,获取计算机网络数据流异常数据,并通过构建卷积神经网络异常数据类型识别模型,有效识别异常数据类型。实验结果表明:该方法可有效挖掘计算机网络大规模高维数据流数据中存在的异常数据,异常数据挖掘与识别准确性较高,可显著提升计算机网络安全性。 展开更多
关键词 加权离群分数 计算机网络 大规模 高维数据流 异常数据挖掘 数据清洗
下载PDF
Intelligent Biometric Information Management
16
作者 Harry Wechsler 《Intelligent Information Management》 2010年第9期499-511,共13页
We advance here a novel methodology for robust intelligent biometric information management with inferences and predictions made using randomness and complexity concepts. Intelligence refers to learning, adap- tation,... We advance here a novel methodology for robust intelligent biometric information management with inferences and predictions made using randomness and complexity concepts. Intelligence refers to learning, adap- tation, and functionality, and robustness refers to the ability to handle incomplete and/or corrupt adversarial information, on one side, and image and or device variability, on the other side. The proposed methodology is model-free and non-parametric. It draws support from discriminative methods using likelihood ratios to link at the conceptual level biometrics and forensics. It further links, at the modeling and implementation level, the Bayesian framework, statistical learning theory (SLT) using transduction and semi-supervised lea- rning, and Information Theory (IY) using mutual information. The key concepts supporting the proposed methodology are a) local estimation to facilitate learning and prediction using both labeled and unlabeled data;b) similarity metrics using regularity of patterns, randomness deficiency, and Kolmogorov complexity (similar to MDL) using strangeness/typicality and ranking p-values;and c) the Cover – Hart theorem on the asymptotical performance of k-nearest neighbors approaching the optimal Bayes error. Several topics on biometric inference and prediction related to 1) multi-level and multi-layer data fusion including quality and multi-modal biometrics;2) score normalization and revision theory;3) face selection and tracking;and 4) identity management, are described here using an integrated approach that includes transduction and boosting for ranking and sequential fusion/aggregation, respectively, on one side, and active learning and change/ outlier/intrusion detection realized using information gain and martingale, respectively, on the other side. The methodology proposed can be mapped to additional types of information beyond biometrics. 展开更多
关键词 Authentication Biometrics Boosting Change DETECTION Complexity Cross-Matching Data Fusion Ensemble Methods Forensics Identity MANAGEMENT Imposters Inference INTELLIGENT Information MANAGEMENT Margin gain MDL Multi-Sensory Integration outlier DETECTION P-VALUES Quality Randomness Ranking score Normalization Semi-Supervised Learning Spectral Clustering STRANGENESS Surveillance Tracking TYPICALITY Transduction
下载PDF
偏正态自回归模型的异常值得分检验
17
作者 刘永辉 陈弘扬 王京 《数理统计与管理》 CSSCI 北大核心 2024年第5期847-855,共9页
本文研究偏正态分布下自回归模型的异常值诊断问题。给出了均值漂移和方差加权这两种异常值模型下得分检验统计量的表达式及其渐进分布,数值模拟证实了该检验方法的有效性。实证部分选取了新冠疫情下雪佛龙股票价格的周数据建立偏正态... 本文研究偏正态分布下自回归模型的异常值诊断问题。给出了均值漂移和方差加权这两种异常值模型下得分检验统计量的表达式及其渐进分布,数值模拟证实了该检验方法的有效性。实证部分选取了新冠疫情下雪佛龙股票价格的周数据建立偏正态自回归模型,比较分析了同一模型下得分检验法诊断出的异常值和局部影响分析方法诊断出的影响点之间的差异性。 展开更多
关键词 自回归模型 异常值检验 均值漂移模型 方差加权模型 得分检验 局部影响分析
原文传递
实验室比对统计分析方法的比较 被引量:27
18
作者 李晶 项新华 张河战 《中国药学杂志》 CAS CSCD 北大核心 2016年第2期139-143,共5页
目的结合国标要求和实际运用,发现目前国内外药品检验中进行实验室比对和能力验证过程常用统计方法的特点和适用条件。方法本文根据ISO/IEC 17043-GB/T28043,从异常值的角度切入,将实验室在检测的稳定性、重复性能力作为重点;对目前国... 目的结合国标要求和实际运用,发现目前国内外药品检验中进行实验室比对和能力验证过程常用统计方法的特点和适用条件。方法本文根据ISO/IEC 17043-GB/T28043,从异常值的角度切入,将实验室在检测的稳定性、重复性能力作为重点;对目前国内外药品检验中进行实验室比对和能力验证过程常用统计方法进行了汇总和对比分析。重点分析能力评价的稳健统计Z比分数法和Grubbs检验的优劣。结果通过对比研究得出不同方法的适用条件。结论稳健Z比分数在现阶段能力验证结果分析中具有较明显优势。 展开更多
关键词 实验室比对 能力验证 离群值 稳健Z比分数 格鲁布斯检测
原文传递
空间误差模型的多个异常值得分检验 被引量:4
19
作者 戴晓文 金立斌 石磊 《数理统计与管理》 CSSCI 北大核心 2015年第6期1007-1015,共9页
本文研究了空间误差模型(SEM)中多个异常值的检验问题,基于均值漂移模型和方差加权模型这两种异常值模型给出了得分检验统计量的具体形式及其渐近分布。并应用实例分析验证了检验统计量的有效性,最后给出了修正模型的方法。
关键词 空间误差模型 异常值检验 均值漂移模型 方差加权模型 得分统计量
原文传递
广义空间异常值修正模型及应用 被引量:3
20
作者 金立斌 戴晓文 +1 位作者 石磊 赵建华 《数理统计与管理》 CSSCI 北大核心 2018年第2期255-263,共9页
本文针对广义空间模型中出现的异常值提出了相应的修正模型。分别基于广义空间模型的均值扰动和方差扰动下提出了对应的异常值修正模型,并给出了参数估计方法。通过将该方法应用于中国能源利用效率的区域特征问题,分析了其中的异常值... 本文针对广义空间模型中出现的异常值提出了相应的修正模型。分别基于广义空间模型的均值扰动和方差扰动下提出了对应的异常值修正模型,并给出了参数估计方法。通过将该方法应用于中国能源利用效率的区域特征问题,分析了其中的异常值并建立了异常值修正模型。该修正模型能有效改进模型拟合效果,为处理数据中出现的异常值提供了一种新的思路。 展开更多
关键词 广义空间模型 异常值 得分统计量 修正模型 能源利用效率
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部