-
题名基于基因表达式编程的频繁函数集挖掘
被引量:22
- 1
-
-
作者
贾晓斌
唐常杰
左劼
陈安龙
段磊
汪锐
-
机构
四川大学计算机学院数据库与知识工程研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2005年第8期1247-1254,共8页
-
基金
国家自然科学基金(60473071)
高等学校博士学科点专项科研基金SRFDP(20020610007)资助
-
文摘
函数挖掘旨在从观测数据中发现有效的函数关系,传统的函数挖掘以发现单个函数为挖掘目标,难以处理复杂数据集.为解决上述问题,作者做了如下工作:(1)提出了描述能力更强的频繁函数集FFS概念;(2)提出并实现了基于基因表达式编程的频繁函数集挖掘算法FFSM;(3)在GEP中采用了精度阈值队列策略PTQ,有效地提高了FFSM的成功率;(4)用实验证实了FFS更强的描述能力和PTQ的有效性,其中,在挖掘高精度复杂函数时PTQ使FFSM的成功率提高了55倍.
-
关键词
频繁函数集
精度阈值队列
基因表达式编程
函数挖掘
-
Keywords
frequent function set
precision threshold queue
gene expression programming
function mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名四维飞行轨迹预测方法的研究
被引量:3
- 2
-
-
作者
王静
张建伟
梁海军
-
机构
四川大学计算机学院
四川大学视觉合成图形图像技术国防重点学科实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第4期1514-1517,1552,共5页
-
基金
国家自然科学基金民航联合基金重点项目(60736046)
-
文摘
通过对空中交通运输管理中目前常用的轨迹预测算法的研究比较和分析,提出了利用遗传算法的从历史数据中进行函数挖掘的思想。针对四维轨迹数据特征的分析和传统的单一函数挖掘的局限性,提出了基于基因表达式编程的频繁函数集挖掘的建模方法。该模型方法通过对历史飞行数据进行遗传算法的操作挖掘出数据集中对应的函数关系集合,用较好的函数模型预测未来航迹。以某一航班雷达数据为训练集做实验,结果表明了应用该方法的准确性和可用性。
-
关键词
四维轨迹预测
空中交通管制
基因表达式编程
频繁函数集
函数挖掘
-
Keywords
4-D trajectory prediction
air traffic control
gene expression programming
frequent function set
function mining
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名基于K均值聚类的大数据频繁项集挖掘研究
被引量:7
- 3
-
-
作者
张娅
-
机构
电子科技大学
-
出处
《计算机仿真》
北大核心
2020年第8期457-461,共5页
-
文摘
针对传统大数据项集挖掘方法存在占用内存较多、挖掘效率较低的问题,提出新的基于K均值聚类的大数据频繁项集挖掘方法。通过对K均值聚类的区间标度变量、二元变量等相似度量的分析来表示样本之间的相似度与离散度,根据样本数据的不同属性选择对应矩阵类型;利用频繁项集自身的约束性质压缩空间,缩小挖掘范围;在K均值聚类基础上,采用fg-growth算法将目标数据高度压缩在fp-tree结构中,并命令原始聚类质心和数量,将其作为K均值的输入,实现大数据频繁项集挖掘。仿真结果证明,研究方法有效降低了挖掘计算复杂度,可保证在内存开销基本不变的情况下高效率挖掘大数据频繁项集。
-
关键词
频繁项集挖掘
样本相似度
准则函数
相似度阈值
-
Keywords
frequent item set mining
Sample similarity
Criterion function
Similarity threshold
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一类Hash函数的注记
- 4
-
-
作者
戴奇华
陈勇明
谢海英
-
机构
成都信息工程学院数学学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第5期1020-1022,共3页
-
基金
国家社会科学基金项目(07XJY033)
成都信息工程学院引进人才科研启动基金项目(KYTZ201001)
-
文摘
研究了一类Hash函数的Hash冲突问题。利用数论中关于整除的相关定理,完整地给出了一类Hash函数已经解决了Hash冲突的理论证明,为该函数的应用提供了可靠的理论基础。算例演示结果表明了该类Hash函数在寻找频繁项目集时的方便性和有效性。
-
关键词
数据挖掘
关联规则
频繁项目集
HASH函数
Hash冲突
-
Keywords
data mining
association rule
frequent item-set
Hash function
Hash colliding
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于敏捷分桶的频繁项目集生成新算法
- 5
-
-
作者
周启海
陈勇明
-
机构
西南财经大学经济信息工程学院
西南财经大学统计学院
-
出处
《计算机科学》
CSCD
北大核心
2007年第12期168-170,共3页
-
文摘
指出用于数据挖掘的频繁项目集生成的常规Hash算法存在两个主要缺点:1)难挑选合适的Hash函数,2)易导致Hash冲突。为了克服了这些缺点,提出了一种能动态适应频繁项目集生成实际需要的敏捷分桶新算法,该算法对任何项目集均有按需反应能力,且无需寻找任何Hash函数,更不会导致任何Hash冲突。同时给出了进一步改进和提高新算法效率的研究方向。
-
关键词
数据挖掘
频繁项目集
HASH函数
Hash冲突
敏捷分桶
-
Keywords
Data mining, frequent item sets, Hash function, Hash conflict, Separate agilely into buckets
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-
-
题名一种顾及模糊属性的空间关联规则挖掘方法
被引量:4
- 6
-
-
作者
许栋浩
李宏伟
张铁映
樊超
朱燕
-
机构
信息工程大学
-
出处
《测绘科学技术学报》
CSCD
北大核心
2016年第3期313-318,共6页
-
基金
国家自然科学基金项目(41140012
41271392
+2 种基金
41401463
41571394)
信息工程大学地理空间信息学院硕士学位论文创新与创优基金(XS201511)
-
文摘
针对传统空间关联规则挖掘对数据硬化分导致的"尖锐边界"问题,提出了一种顾及模糊属性的空间关联规则挖掘方法。该方法引入模糊集理论,将模糊空间属性通过隶属函数转化为隶属度表示的模糊数值,从而将其划分为模糊集合。然后使用改进的模糊关联规则挖掘算法扫描数据库,根据相应的支持度得到频繁项集,最终提取出关联规则。实验结果表明,该方法能够对带有模糊属性的空间数据进行关联规则挖掘,且在一定程度上提高了挖掘结果的兴趣度。
-
关键词
模糊集
隶属函数
频繁项
离散化
空间关联规则
-
Keywords
fuzzy set
membership function
frequent items
discretization
spatial association rules
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名基于关联规则算法的网络安全隐患数据挖掘研究
被引量:3
- 7
-
-
作者
林丹生
曾智勇
李祥林
梁智强
-
机构
南方电网电力科技股份有限公司
广东华电韶关热电有限公司
广州大学网络智能实验室
-
出处
《自动化仪表》
CAS
2023年第9期71-75,81,共6页
-
文摘
网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算关联权值和平均值,由此获取数据项集关联度的准确性。通过判别关联程度,完成数据预处理。采用Apriori算法对预处理后的数据进行量化处理,抽取、挖掘、记录可应用数据信息。利用亲和度函数建立目标函数,以获取隐患数据。建立关联规则,以确保隐患数据差异。以可信度结果为基础,构建网络安全隐患数据挖掘模型,实现网络安全隐患数据挖掘。试验结果表明,采用此模型后,执行时间较短、挖全率较高、数据挖掘过程中占用的内存较少。该研究可为网络安全隐患数据挖掘系统设计提供有效支持。
-
关键词
关联规则算法
网络安全隐患
数据挖掘
最小支持度
频繁项集
目标函数
关联权值
亲和度函数
-
Keywords
Association rule algorithm
Network security hazards
Data mining
Minimum support
frequent item set
Objective function
Association weights
Affinity function
-
分类号
TH164
[机械工程—机械制造及自动化]
-