-
题名基于模糊遗传算法的数据库异常数据挖掘
被引量:17
- 1
-
-
作者
向桢
向守兵
-
机构
四川工程职业技术学院
-
出处
《控制工程》
CSCD
北大核心
2017年第5期947-951,共5页
-
文摘
对大型数据库的异常数据准确挖掘是实现数据库系统的故障诊断和检测的关键技术。异常数据具有复杂性和多样性,传统方法难以对其进行准确、有效识别。为了提高异常数据挖掘性能,提出一种基于改进模糊遗传算法的大型数据库异常数据挖掘算法。构建大型数据库的异常数据信息特征模型,数据训练样本在进行遗传迭代状态下执行更新平滑,依据平方差函数值较小为原则更新簇的中心点,求得异常数据的功率谱密度函数作为特征,进行异常数据特征优选,计算异常数据流信息聚焦在多层空间模糊聚类中心,将训练集与所属的类别进行关联,得到异常数据的属性集分类和信息增益,从而提高数据的挖掘性能。仿真实验结果表明,该算法具有较高的异常数据检测和挖掘性能,挖掘识别能力优于传统模型,具有较好的应用价值。
-
关键词
遗传算法
大型数据库:异常数据挖掘
-
Keywords
Genetic algorithm
large database
data mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名大型数据库中多层关联规则的挖掘算法
被引量:4
- 2
-
-
作者
高峰
谢剑英
-
机构
上海交通大学自动化系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2000年第10期75-76,142,共3页
-
文摘
将基于垂直数据分布的关联规则的发现从单层概念扩展到多层概念,提出了自顶向下的、用等价类生成频繁项目集的发现算法,无需复杂的Hash数据结构。该算法减少了项目的匹配计算,提高了挖掘的效率。
-
关键词
数据挖掘
关联规则
等价类
算法
大型数据库
-
Keywords
Data mining
Association rules
Equivalence class
Concept hierarchy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名大型事务数据库中的一种快速的规则挖掘算法
被引量:4
- 3
-
-
作者
朱玉全
孙志挥
-
机构
东南大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2002年第10期59-60,69,共3页
-
基金
国家自然科学基金(项目编号79970092)
-
文摘
1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生。算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果。但总的来讲,许多研究都是在Apriori算法或其派生算法的基础上进行的。这些算法或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集;
-
关键词
大型事务数据库
规则挖掘算法
数据挖掘
知识发现
-
Keywords
Data mining,Association rules,Transaction databases
-
分类号
TP311.135
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于聚类优化的大型网络数据库挖掘系统设计
被引量:3
- 4
-
-
作者
姜姗
任靖娟
高志宇
-
机构
河南中医药大学信息技术学院
-
出处
《现代电子技术》
北大核心
2020年第6期175-177,182,共4页
-
基金
河南省重点研发与推广专项科技攻关项目(14104660 2019)
2019年度河南省高等学校重点科研项目(19A520005)。
-
文摘
传统的数据库挖掘系统是基于粗略集合方法进行挖掘,该系统在面对庞大的数据量时,系统运行效率较差,为此设计基于聚类优化的大型网络数据库挖掘系统。搭建数据采集所需的传感器节点结构,选择CC3200作为主控芯片,在原有的电路中引入射频通信电路,实现数据的无线传输;在此基础上,对数据库中数据进行预处理,利用优化后的聚类算法和软件程序实现数据挖掘,至此系统设计完成。测试结果表明:与传统的数据库挖掘系统相比,基于聚类优化的大型网络数据库挖掘系统在处理庞大的数据量时,系统始终保持较高的运行效率,适合应用在大型网络数据库中。
-
关键词
大型网络
数据库挖掘系统
聚类优化
数据传输
系统设计
仿真测试
-
Keywords
large networks
database mining system
clustering optimization
data transmission
system design
simulation test
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于OCAR挖掘的数据库异常检测模型
被引量:1
- 5
-
-
作者
戴华
秦小麟
刘亮
柏传杰
-
机构
南京航空航天大学信息科学与技术学院
-
出处
《通信学报》
EI
CSCD
北大核心
2009年第9期7-14,共8页
-
基金
国家自然科学基金资助项目(60673127)
国家高技术研究发展计划("863"计划)基金资助项目(2007AA01Z404)
江苏省科技支撑计划基金资助项目(BE2008135)~~
-
文摘
提出了一种基于OCAR挖掘的数据库异常检测模型,通过对含有WHERE条件的SQL语句唯一确定的完全条件表达式进行特征提取和形式化分析,挖掘表征用户正常行为模式的目标—条件关联规则集(OCARS),并利用OCARS进行数据库异常检测,给出了针对OCARS的挖掘算法和异常检测算法,并给出针对事务异常检测扩展方案。最后,通过SQL注入检测实验对模型的性能和应用作了分析。
-
关键词
数据库安全
异常检测
数据挖掘
目标-条件关联规则
-
Keywords
database security
anomaly detection
data mining
object-condition association rule
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名挖掘大型数据库中的Apriori算法及其改进
被引量:17
- 6
-
-
作者
宋中山
-
机构
中南民族大学计算机科学学院
-
出处
《中南民族大学学报(自然科学版)》
CAS
2003年第1期54-57,共4页
-
基金
国家民委科研基金资助项目 (990 10 1)
-
文摘
指出了 Apriori算法是一种有效的关联规则挖掘算法 ,分析和探讨了 Apriori算法 ,并给出了该算法的实现思想 ,通过实例说明了算法的执行过程 ,提出了对 Apriori算法进行改进的一些方法 :散列、事务压缩、划分、选样及动态项集计数 .使用这些技术提高了算法的效率 .
-
关键词
数据挖掘
大型数据库
关联规则
APRIORI算法
事务压缩
动态项集
知识发现
-
Keywords
data mining
association rules
Apriori algorithms
frequent itemset
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名并行数据库中异常数据优化分类挖掘方法研究
被引量:4
- 7
-
-
作者
杨秀荣
-
机构
运城学院计算机科学与技术系
-
出处
《微电子学与计算机》
CSCD
北大核心
2015年第10期125-128,133,共5页
-
基金
国家自然科学基金(11241005)
-
文摘
提出一种考虑语义特征聚类紧密性与分离性特征分析的并行数据库中异常数据优化分类挖掘算法.构建并行数据库异常数据的语义特征分离性度量模型,设计语义映射网络结构,实现对异常数据的噪点初步分离,设计面向语义特征聚类的紧密性与分离性特征提取算法,对含有噪点和野值的并行数据库环境进行干扰抑制,实现对异常数据库优化分类挖掘.仿真结果表明,该算法提高了对并行数据库中异常数据搜索过程中的挖掘查准率,分类挖掘紧密度和准确度较高.
-
关键词
并行数据库
异常数据
挖掘
聚类
-
Keywords
parallel database
abnormal data
mining
clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名大型数据库中异常信息检测仿真研究
被引量:6
- 8
-
-
作者
薛鑫
-
机构
河南科技大学图书馆
-
出处
《计算机仿真》
北大核心
2017年第8期399-402,共4页
-
文摘
对大型数据库中异常信息的检测,可以确保数据库的安全访问和网络运行稳定性。对大型数据库中异常数据的检测,需要获取滤波前的异常信息相位特征,分析数据偏移程度,并对检测滤波模型进行修正,完成异常信息的检测。传统方法通过获取异常信息的线性调频信号幅频特性,建立异常信息传输模型,但忽略了对传输模型进行修正,导致异常信息检测精度偏低。提出基于大数据与决策树分类特征滤波检测的大型数据库中异常信息的检测方法。通过建立大型数据库中异常信息的决策树信息传输模型,采用基于决策树异常分类特征滤波算法,根据局部特征时间尺度参数获取滤波前的异常信息相位特征,分析数据偏移程度,并对检测滤波模型进行修正,最终实现了大型数据库中异常信息的检测。仿真结果表明,提出方法能有效提高大型数据库中异常信息的检测精度和检测效率,具有良好的实用性。
-
关键词
大型数据库
异常信息
检测
-
Keywords
Large database
Abnormal information
Detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名大型数据库的关联挖掘算法设计
被引量:2
- 9
-
-
作者
黄瑜
-
机构
钦州学院
-
出处
《现代电子技术》
北大核心
2018年第20期45-48,共4页
-
基金
广西教育厅高校科研项目(KY2015YB314)~~
-
文摘
针对大型数据库在进行关联挖掘过程中,挖掘准确度低、效率差的问题,提出并设计了基于贝叶斯信息标准BIC评分函数的大型数据库关联挖掘算法。在对大型数据库关联数据获取基础上,采用贝叶斯信息标准BIC评分函数对数据进行预处理,并给出预处理流程,建立挖掘所需的新关联规则,根据其关联规则实现大型数据库的关联挖掘。实验结果表明,采用改进挖掘算法,其挖掘准确率达到了91.3%,相比传统挖掘算法提高了约35.9%,具有一定的优势。
-
关键词
大型数据库
关联规则
挖掘算法
关联挖掘
评分函数
数据预处理
-
Keywords
large-scale database
association rule
mining algorithm
association mining
scoring function
data prepro-cessing
-
分类号
TN919.25-34
[电子电信—通信与信息系统]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种针对大型事务数据库的关联规则挖掘算法
被引量:2
- 10
-
-
作者
崔建
李强
王国师
-
机构
空军雷达学院研究生管理大队
空军雷达学院四系
-
出处
《空军雷达学院学报》
2011年第3期205-208,共4页
-
文摘
为进一步解决对大型数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁问题,给出一种改进的关联规则挖掘算法(ARMAC).该算法引入有向无环图和tidlist结构用以提高频繁项目集的计算效率,并将数据库划分为内存可以满足要求的若干部分,解决了对大型数据库挖掘时磁盘操作频繁的问题,从而有效地适用于大型数据库的关联规则挖掘.该算法吸取连续关联规则挖掘(CARMA)算法的优势,只需扫描两次数据库便可完成挖掘过程.实验结果表明:该算法在大型事务数据库中具有更高的执行效率.
-
关键词
数据挖掘
频繁项集
大型数据库
有向无环图
关联规则
-
Keywords
data mining
frequent item sets
large database
directed acyclic graph(DAG)
association rules
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于大型数据库的数据挖掘
被引量:1
- 11
-
-
作者
赵少卡
-
机构
福建师范大学福清分校数学与计算机科学系
-
出处
《福建电脑》
2007年第12期115-116,共2页
-
文摘
本文提出一种面向大规模数据库的综合性数据挖掘技术。鉴于大规模数据库拥有庞大的数据和信息量,本文在传统的数据挖掘算法基础上使用了一些优化算法,如快速Apriori算法、Birch聚类算法等。结合理论结果,将数据挖掘应用于大型系数据库,基于关系数据库的实验表明数据挖掘系统的整体性能得到了有效提高。
-
关键词
数据挖掘
大型数据库
聚类
分类
APRIORI算法
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名大型数据库中数据挖掘算法SLIQ的研究及仿真
- 12
-
-
作者
郭新宇
梁循
-
机构
北京大学计算机科学技术研究所
-
出处
《中国管理科学》
CSSCI
2004年第z1期79-82,共4页
-
文摘
大型数据库中的数据挖掘是目前数据挖掘领域重要的前沿课题.SLIQ算法是处理大型数据库数据的有效算法之一.该算法分为三个阶段:在预处理阶段,对数值属性进行预排序;在树的构建阶段采用了树的宽度优先增长策略,使得SLIQ能够处理海量的磁盘数据;在树的修剪阶段,采用了一种基于最小描述长度原理的修剪算法.实验结果表明,SLIQ能够较快且准确地处理海量的数据.
-
关键词
大型数据库
数据挖掘
SLIQ算法
gini指标
-
分类号
C931
[经济管理—管理学]
-
-
题名大型差异数据库中高伪装入侵数据挖掘方法
被引量:2
- 13
-
-
作者
徐良
-
机构
青海警官职业学院
-
出处
《电子设计工程》
2020年第5期112-115,120,共5页
-
文摘
针对传统入侵数据挖掘方法存在的挖掘精准性差、挖掘效率低的问题,提出一种大型差异数据库中高伪装入侵数据挖掘方法。采用粒子群分辨树算法检测大型差异数据库的入侵情况;为了避免特征提取维数偏高,对数据进行离散化处理,计算数据聚类间距距离,获取隐形文本数据特征并对数据特征压缩;根据数据筛选算法流程对数据进行处理,结合Apriori算法检查数据库中各项矩阵,排除掉与实际关系不相符的数据,进而形成拓扑结构并对其概化处理,实现高伪装入侵数据挖掘。通过实验对比结果可知,该方法挖掘效率最高可达到97%,且挖掘结果与实际值相差较小,为数据库安全使用提供保障。
-
关键词
大型差异数据库
高伪装数据
入侵数据
挖掘
-
Keywords
large difference database
high camouflage data
data intrusion
mining
-
分类号
TN49
[电子电信—微电子学与固体电子学]
-
-
题名一种基于数据库分解的关联规则挖掘新算法
被引量:3
- 14
-
-
作者
杨翠明
刘喜苹
熊高峰
罗隆福
-
机构
湖南大学电气与信息工程学院
长沙南方职业学院
-
出处
《湖南师范大学自然科学学报》
CAS
北大核心
2007年第2期30-34,共5页
-
基金
国家技术创新资助项目[国经贸技术(2002)845号]
-
文摘
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.
-
关键词
大型数据库
关联规则
数据库分解
数据挖掘
约束频繁项挖掘
FP-GROWTH
-
Keywords
large dataset
assoeiation rule
division of dataset
data mining
constrained frequent item sets mining
Fp-growth
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名物联网差异数据库中的故障数据快速挖掘仿真
被引量:6
- 15
-
-
作者
钱晓军
范冬萍
吉根林
-
机构
南京师范大学计算机学院
-
出处
《计算机仿真》
CSCD
北大核心
2016年第1期301-304,共4页
-
基金
江苏省科技支撑计划(BE2013685)
江苏省前瞻性联合研究计划项目(BY2014001-03)
-
文摘
对大型物联网环境下的差异数据库中的故障数据进行准确检测时,由于大型物联网环境下差异数据库受到环境状况和数据质量的影响,造成故障数据挖掘时数据特征描述不准确。传统的算法在故障数据挖掘过程中,由于受到不准确特征的影响,无法准确划分故障数据与非故障数据的邻域,导致挖掘准确率降低。提出采用离群点算法的大型物联网环境下的差异数据库中的故障数据挖掘方法。将差异数据库中的数据属性分为故障属性和非故障属性,用故障属性计算故障邻域,用非故障属性确定数据的故障离群度,对差异数据库中的所有的数据的故障离群程度进行计算,并进行降序排列,从而完成故障数据的挖掘。实验结果表明,利用改进算法进行差异数据库中的故障数据挖掘,能够有效提高挖掘的准确率,降低挖掘耗时。
-
关键词
大型物联网
差异数据库
故障数据
挖掘
-
Keywords
Large internet of things
Differences in the database
Failure data
Mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据库异常数据的检测仿真研究
被引量:10
- 16
-
-
作者
王乐
王芳
-
机构
郑州大学西亚斯国际学院
-
出处
《计算机仿真》
CSCD
北大核心
2016年第1期430-433,共4页
-
文摘
在对数据库异常数据检测的研究中,由于进行异常数据挖掘时,都是依靠异常数据表现出的特征,根据模式识别的原理,进行异常数据的检测的。当在搜索的历史数据库中,异常数据的特征变量不具有明显性,会导致存在挖掘精度低的问题。为解决上述问题,提出采用模糊自适应映射理论算法的数据库异常数据挖掘方法。该方法先采用分段量化的方法来获取历史数据库中异常数据的特征变量,组建可以表述异常数据状态的关键数据点集合,并将其离散化。然后将模糊算法融合于自适应映射拓扑网络中,组建模糊自适应映射网络数据模型,最后通过计算模型中表述输入与输出关系的模糊参数,实现对数据库中异常数据的精确挖掘。仿真结果证明,采用模糊自适应映射理论的数据库异常数据挖掘方法的挖掘时间短,精确度高。
-
关键词
数据库
自适应映射理论
异常数据挖掘
-
Keywords
Database
Adaptive mapping theory
Abnormal data mining
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名某机载雷达数据库关联规则挖掘算法研究
被引量:2
- 17
-
-
作者
崔建
李强
吴瑕
-
机构
空军雷达学院预警监视情报系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第18期16-18,21,共4页
-
基金
国家自然科学基金资助项目(60736009)
-
文摘
某机载雷达数据库中包含大量连续属性和分类属性,且数据库规模庞大。为此,给出一种改进的模糊关联规则挖掘算法。该算法引入有向无环图和字节向量用以提高频繁项目集的计算效率,解决挖掘时磁盘操作频繁的问题,并定义新的模糊度量提高正规则的识别概率。实验结果表明,该算法比传统算法具有更高的执行效率和准确率。
-
关键词
大型机载雷达数据库
QL-算子
字节向量结构
模糊度量
数据挖掘
-
Keywords
large airborne radar database
QL-operator
byte-vector structure
fuzzy measure
data mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名KMApriori:一种有效的数据库异常检测方法
被引量:4
- 18
-
-
作者
邝祝芳
谭骏珊
-
机构
中南林业科技大学计算机科学学院
-
出处
《计算机工程与科学》
CSCD
2008年第6期18-21,28,共5页
-
文摘
本文提出了一个基于聚类分析与关联规则挖掘技术的有效数据库异常检测KMApriori方法,设计了一个系统框架,研究了该框架中的关键技术。通过实验表明,KMApriori方法能够检测出数据库用户的异常行为。与基于关联规则挖掘技术的数据库异常检测Apriori方法相比,在时间开销上,KMApriori方法优于Apriori方法,并且随着数据量的增加,KMApriori的优越性更明显;此外,KMApriori方法检测正确率也高于Apriori方法。
-
关键词
数据库安全
异常检测
聚类分析
关联规则挖掘
-
Keywords
database security
anomaly detection
clustering analysis
associate rule mining
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名大型数据库的数据挖掘应用剖析
被引量:1
- 19
-
-
作者
叶符明
-
机构
贵州商学院计算机与信息工程学院
-
出处
《数字技术与应用》
2018年第9期89-90,共2页
-
文摘
近年来,随着互联网技术的发展,各行各业之间的信息存档都上传成为数据库的数据,这样相比较传统的纸质档案更加容易被查找以及保存,但是随着行业的发展,上传的数据越来越多,导致企业在查找时无法及时的查询到自己需要的信息,介于这样的情况,人们开始研究智能型的大型数据库的数据挖掘方法,本文根据数据挖掘的含义特征进行分析,探究大型数据库中数据挖掘的算法以及在实际中的运用方向。
-
关键词
大型
数据库
数据挖掘
应用
-
Keywords
large
database
data mining
application
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于大数据库的数据挖掘应用研究
被引量:5
- 20
-
-
作者
徐延强
-
机构
兰州工业学院
-
出处
《中国新通信》
2018年第8期121-121,共1页
-
文摘
随着信息时代的到来,人们处理信息的方式越来越多种多样,传统的数据检索和处理技术已经不能满足人们的日常工作需求,为此,人类开始将关注重点放在大型数据库的数据挖掘技术上面,对成功提高了工作人员的信息处理效率,在一定程度上推动了大数据时代的发展。本文就基于大型数据库的数据挖掘技术进行研究,分析了其当前的应用情况以及未来的应用前景。
-
关键词
数据挖掘技术
大型数据库
应用研究
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-