-
题名基于密度偏倚抽样的局部距离异常检测方法
被引量:18
- 1
-
-
作者
付培国
胡晓惠
-
机构
中国科学院大学
天基综合信息系统重点实验室(中国科学院软件研究所)
-
出处
《软件学报》
EI
CSCD
北大核心
2017年第10期2625-2639,共15页
-
基金
国家自然科学基金(U1435220)
国家高技术研究发展计划(863)(2012AA011206)~~
-
文摘
异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算法运算效率,然而检测效果欠佳.基于此,提出一种基于密度偏倚抽样的局部距离异常检测算法,首先利用基于密度偏倚的概率抽样方法对所需检测的数据集合进行概率抽样,之后对抽样数据利用基于局部距离的局部异常检测方法,对抽样集合进行局部异常系数计算,得到的异常系数既是抽样数据的局部异常系数,又是数据集的近似全局异常系数.然后对得到的每个数据点的局部异常系数进行排序,异常系数值越大的数据点越可能是异常点.实验结果表明,与已有的算法相比,该算法具有更高的检测精确度和更少的运算时间,并且该算法对各种维度和数据规模的数据都具有很好的检测效果,可扩展性强.
-
关键词
异常检测
局部异常系数
局部距离
密度偏倚抽样
SLDOF算法
-
Keywords
anomaly detection
outlier factor of local set
local distance
density-based sampling
SLDOF algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名形式化方法概貌
被引量:85
- 2
-
-
作者
王戟
詹乃军
冯新宇
刘志明
-
机构
国防科技大学计算机学院
高性能计算国家重点实验室(国防科技大学)
中国科学院软件研究所
天基综合信息系统重点实验室(中国科学院软件研究所)
南京大学计算机科学与技术系
计算机软件新技术国家重点实验室(南京大学)
西南大学计算机与信息科学学院
西南大学软件研究与创新中心
-
出处
《软件学报》
EI
CSCD
北大核心
2019年第1期33-61,共29页
-
基金
国家自然科学基金(61532007
61632005
+1 种基金
61672435
61732019)~~
-
文摘
形式化方法是基于严格数学基础,对计算机硬件和软件系统进行描述、开发和验证的技术.其数学基础建立在形式语言、语义和推理证明三位一体的形式逻辑系统之上.形式化方法已经以不同程度和不同方式愈来愈多地应用在计算系统生命周期的各个阶段.介绍了形式化方法的发展历程和基本方法体系;以形式规约和形式验证为主线,综述了形式化方法的理论、方法、工具和应用的现状,展示了形式化方法与软件学科其他领域的交叉和融合;分析了形式化方法的启示,并展望了其面临的发展机遇和未来趋势.形式化方法的发展和研究现状表明:其应用已经取得了长足的进步,在提高计算系统的可靠性和安全性方面发挥了重要作用.在当今软件日益成为社会基础设施的时代,形式化方法将与人工智能、网络空间安全、量子计算、生物计算等领域和方向交叉融合,得到更加广阔的应用.研究和建立这种交叉融合的理论和方法不仅重要,而且具有挑战性.
-
关键词
形式化方法
形式规约
形式验证
程序设计方法学
软件开发
-
Keywords
formal method
formal specification
formal verification
programming methodology
software development
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向大数据分析作业的启发式云资源供给方法
被引量:12
- 3
-
-
作者
吴悦文
吴恒
任杰
张文博
魏峻
王焘
钟华
-
机构
中国科学院软件研究所软件工程技术中心
天基综合信息系统重点实验室(中国科学院软件研究所)
中国科学院大学
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第6期1860-1874,共15页
-
基金
国家重点研发计划(2017YFB1400804)
北京市自然科学基金(4182070)
+1 种基金
蚂蚁金服科研基金(XZ502017000730)
中国科学院青年创新促进会人才专项(2018144)。
-
文摘
云计算已成为大数据分析作业的主流运行支撑环境,选择合适的云资源优化其性能面临巨大挑战.当前研究主要考虑大数据分析框架(如Hadoop,Spark等)的多样性,采用机器学习方法进行资源供给,但样本少容易陷入局部最优解.提出了大数据环境下基于负载分类的启发式云资源供给方法RP-CH,基于云资源共享特点,获取其他大数据分析作业的运行时监测和云资源配置信息,建立负载分类与优化云资源配置的启发式规则,并将该规则作用到贝叶斯优化算法的收益函数.基于HiBench,SparkBench测试基准的结果显示:RP-CH相对于已有方法CherryPick、大数据分析作业的性能平均提升了58%,成本平均减少了44%.
-
关键词
大数据分析
云计算
启发式
云资源供给
贝叶斯优化
-
Keywords
big data analytics
cloud computing
heuristic
cloud resource provisioning
Bayesian optimization
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-