大型数据库中利用强化学习改进treap的关联规则挖掘算法被引量：10

Association rule mining algorithm using improving treap with interpolation algorithm in large database

下载PDF

导出

摘要信息的爆炸式增长使数据挖掘分析过程更加困难,针对普通关联规则挖掘算法很难在短运行时间和低关联度的前提下完成大型数据库中变量关系的评估和发现的问题,提出利用强化学习算法改进treap的大型数据库关联规则挖掘算法。提出的算法首先计算数据库中每个变量的优先级;然后,在优先级模型中利用强化学习算法改进的build-treap程序构建treap数据结构;最后,通过遍历程序和generateRule程序完成数据库中所需的关系查找。在对提出的算法进行稳定性分析后进行了仿真验证实验,实验结果表明,提出的算法在其最次和最佳案例分析中分别能够完成O(n log n)次和O(n 2)次挖掘,能够在较短时间内完成低关联度的大型数据库中变量关系挖掘任务,相对于改进型Apriori算法和改进型FP生长算法有较大提升。 The explosive growth of information makes the process of data mining and analysis more difficult.It is very difficult for the common association rules mining algorithm to evaluate and discover the relationship between variables in large database under the premise of short running time and low correlation degree.This paper presented an algorithm for mining association rules in large databases based on improved treap.Firstly,the algorithm calculated the priority of each variable in the database.Then,it constructed the treap data structure by the interpolation algorithm to improve build-treap program in the priority model.Finally,it found the relationship of the database by traversing the program and generateRule program.After the stability analysis of the proposed algorithm,the simulation results show that the proposed algorithm can mine the O(n log n)times and O(n 2)times in the worst-case analysis and the best-case analysis,respectively.The algorithm can complete the task of variable relational mining in a large database with low correlation degree in a short time,which is much better than the traditional Apriori algorithm and FP growth algorithm.

作者辛春花郭艳光鲁晓波 Xin Chunhua;Guo Yanguang;Lu Xiaobo(Dept.of Computer Technology&Information Management,Inner Mongolia Agricultural University,Baotou Inner Mongolia 014109,China)

机构地区内蒙古农业大学计算机技术与信息管理系

出处《计算机应用研究》 CSCD 北大核心 2021年第1期88-92,共5页 Application Research of Computers

基金国家自然科学基金资助项目(31660602,31660701,31960361) 内蒙古自然科学基金资助项目(2017BS403) 内蒙古自治区高等学校科学研究项目(NJZY20055)。

关键词改进型treap算法强化学习算法大型数据库优先模型关联规则 improved treap algorithm interpolation algorithm large data base priority model association rules

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1武优西,周坤,刘靖宇,江贺,吴信东.周期性一般间隙约束的序列模式挖掘[J].计算机学报,2017,40(6):1338-1352. 被引量：12
2周晓清,肖鸣宇.无向图中子集反馈顶点集问题的精确算法[J].计算机学报,2018,41(3):493-505. 被引量：3
3周南,田学东.LaTeX数学表达式解析与索引方法[J].计算机应用,2016,36(3):833-836. 被引量：5
4张春,周静.动车组运维效率关联规则挖掘优化算法[J].计算机研究与发展,2017,54(9):1958-1965. 被引量：3
5何占军,邓敏,蔡建南,刘启亮.顾及背景知识的多事件序列关联规则挖掘方法[J].武汉大学学报（信息科学版）,2018,43(5):766-772. 被引量：13
6周传华,柳智才,丁敬安,周家亿.基于filter+wrapper模式的特征选择算法[J].计算机应用研究,2019,36(7):1975-1979. 被引量：20
7王玲,孟建瑶,李俊飞,彭开香.基于多维时态关联规则的演化模糊推理预测算法[J].自动化学报,2018,44(8):1446-1459. 被引量：9
8董思岐,李海龙,屈毓锛,胡磊.面向优先级用户的移动边缘计算任务调度策略[J].计算机应用研究,2020,37(9):2701-2705. 被引量：10
9Xi-bin JIA,Ya JIN,Ning LI,Xing SU,Barry CARDIFF,Bir BHANU.基于关联规则进行词对齐的跨领域情感分类算法（英文）[J].Frontiers of Information Technology & Electronic Engineering,2018,19(2):260-272. 被引量：4

二级参考文献38

1刘毅.关于Treap数据结构问题的研究[J].计算机应用与软件,2005,22(8):36-38. 被引量：2
2MINER R, MUNAVALLI R. An approach to mathematical search through query formulation and data normalization [ M]// KAUERS M, KERBER M, MINER R, et al. Towards Mechanized Mathematical Assistants, LNCS4573. Berlin: Springer, 2007:342-355.
3LIBBRECHT P, MELIS E. Semantic search in leactivemath [ EB/ OL]. [ 2015- 03- 12]. http://www, hoplahup, net/copyleft/Lib- brecht-etal-Semantic-Search-WebALT-06, pdf.
4GUO W, SU W, LI L, et al. MQL: a mathematical formula query language for mathematical search [ C]// CSE 2011 : Proceedings of the 2011 14th International Conference on Computational Science and Engineering. Piscataway, NJ: IEEE, 2011: 245 - 250.
5LIN X, GAO L, HU X, et al. A mathematics retrieval system for formulae in layout presentations [ C]//SIGIR '14: Proceedings of the 37th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2014:697 -706.
6HU X, GAO L, LIN X, et al. WikiMirs: a mathematical informa- tion retrieval system for Wikipedia [ C]//JCDL '13: Proceedings of the 13th ACM/IEEE-CS Joint Conference on Digital libraries. New York: ACM, 2013:11 -20.
7TIAN X, YANG S, LI X, et al. An indexing method of mathematical expression retrieval [ C]//Proceedings of the 2013 3rd International Conference on Computer Science and Network Technology. Piscataway, NJ: IEEE, 2013:574 -578.
8ZANIBBI R. Recognition of mathematics notation via computer using baseline structure [ EB/OL]. [ 2015- 04- 02]. http://research, cs. queensu, ca/TechReports/Reports/2000-439, pdf.
9沙宗尧,李晓雷.异质环境下的空间关联规则挖掘[J].武汉大学学报（信息科学版）,2009,34(12):1480-1484. 被引量：5
10朱颢东,钟勇.基于改进的ID3信息增益的特征选择方法[J].计算机工程,2010,36(8):37-39. 被引量：8

共引文献70

1宰新宇,田学东.基于公式描述结构和词嵌入的科技文档检索方法[J].数据分析与知识发现,2020,4(1):131-138. 被引量：4
2陈军,刘万增,武昊,李志林,赵勇,张蓝.基础地理知识服务的基本问题与研究方向[J].武汉大学学报（信息科学版）,2019,44(1):38-47. 被引量：47
3田学东,崔晓娟.基于数学表达式特征的科技文档检索模型[J].河北大学学报（自然科学版）,2017,37(6):652-661. 被引量：1
4郭静,陈欣,何杰,谭志国.时间序列的区域周期模式及挖掘算法[J].小型微型计算机系统,2018,39(10):2180-2185.
5孙强,洪娅岚.面向海洋净处理生产力的关联规则挖掘算法[J].科技创新与生产力,2019(4):54-58.
6周忠玉,皮德常.面向卫星遥测数据流的最小稀有模式挖掘方法[J].计算机学报,2019,42(6):1351-1366. 被引量：9
7林甲祥,高敏节,陈崇成,巫建伟,王雪平,张泽均.个性化旅游景点推荐中考虑约束的关联规则挖掘算法[J].福州大学学报（自然科学版）,2019,47(3):320-326. 被引量：7
8柴欣,王建姣,闫文杰,武优西.无间隙约束下无重叠模式匹配的在线求解算法[J].小型微型计算机系统,2019,40(7):1491-1495.
9周晓清,叶安胜,张志强.无向图中连通支配集问题的精确算法[J].计算机应用研究,2019,36(9):2569-2574. 被引量：6
10常文兵,苑星龙,周晟瀚,李磊.基于文本分析的故障序列模式挖掘算法[J].计算机应用研究,2019,36(9):2643-2646. 被引量：2

同被引文献125

1杨捷,李沛霖,罗成臣,洪锋.基于数据挖掘的电网用户行为分析[J].云南大学学报（自然科学版）,2020,42(S02):38-43. 被引量：22
2王志强,郑婷婷,孙鑫,李清.基于一种新的q-rung orthopair模糊交叉熵的属性约简算法[J].计算机科学,2022,49(S02):324-329. 被引量：1
3陈万志,赵宇璇.智慧校园隐式用户行为的数据挖掘方法[J].辽宁工程技术大学学报（自然科学版）,2020(5):434-439. 被引量：13
4郭玲娟,魏斌,韩肖清,李雯.基于集合经验模态分解的交直流混合微电网混合储能容量优化配置[J].高电压技术,2020,46(2):527-537. 被引量：73
5张富利,郑海山.大数据时代人工智能辅助量刑问题研究[J].昆明理工大学学报（社会科学版）,2018,18(6):1-10. 被引量：8
6沈翔,杨洪耕,段晨.基于灰靶理论与云模型的电压暂降事件数据挖掘分析方法[J].电网技术,2019,43(2):722-730. 被引量：22
7潘玮,牟冬梅,李茵,刘鹏.关键词共现方法识别领域研究热点过程中的数据清洗方法[J].图书情报工作,2017,61(7):111-117. 被引量：42
8高一飞,高建.智慧法院的审判管理改革[J].法律适用,2018(1):58-64. 被引量：33
9何占军,邓敏,蔡建南,刘启亮.顾及背景知识的多事件序列关联规则挖掘方法[J].武汉大学学报（信息科学版）,2018,43(5):766-772. 被引量：13
10季鼎承,蒋亦樟,王士同.基于域与样例平衡的多源迁移学习方法[J].电子学报,2019,47(3):692-699. 被引量：14

引证文献10

1王宝莹,李泊宁,徐天柱,刘亚平.基于聚类算法的算法裁判的研究[J].科学与信息化,2020(32):64-64.
2刘张榕.基于大数据集的动态数据库关联挖掘研究[J].微型电脑应用,2021,37(12):60-62. 被引量：4
3彭灿华,韦晓敏.基于LDA主题模型的多数据库主题词挖掘算法[J].计算机仿真,2023,40(8):483-487.
4周春雷,董新微,季良,张璧君,许中平.基于改进DTW算法的高维时空数据关联挖掘方法[J].电子设计工程,2023,31(24):141-144.
5杨子成,卢建生,王超,郭海旭.基于关联规则挖掘的电炉电能计量装置异常诊断系统[J].工业加热,2023,52(11):38-42.
6陈琳.基于时空序列相似性的大规模内网数据库非法访问信息的挖掘算法[J].江苏理工学院学报,2023,29(6):23-30.
7沈芙辉,苏欣.基于对比阈值的大数据流特征量最优挖掘算法[J].计算机仿真,2023,40(11):319-323.
8卢思安,刘江平.协同过滤下混合大数据无损挖掘算法研究[J].计算机仿真,2024,41(4):485-488. 被引量：1
9胡萍,廉哲.改进粒计算算法下时序数据关联规则挖掘仿真[J].计算机仿真,2024,41(3):448-452.
10项丽,郑伟,宁永龙,康健,宫建锋.基于多尺度混合算法的电压跌落数据挖掘系统设计[J].电子设计工程,2024,32(11):55-59.

二级引证文献5

1马国春,姚远.新一代警用地理信息系统PGIS 2.0框架和关键技术研究[J].微型电脑应用,2023,39(10):138-140.
2王天师.面向典型作业场景的现场安全监管数据库风险识别方法[J].微型电脑应用,2024,40(2):66-69.
3潘华贤.FOA优化极限学习机算法及模型应用研究[J].微型电脑应用,2024,40(3):108-111.
4韩俊华,王奇,叶淑晴.基于GIS的排水井盖安全监控预警系统设计[J].智能城市,2024,10(4):65-67.
5李旭东,金鑫,郭非,胡华,胡武,韩英军.大数据背景下烟草生产控制专业平台设计[J].微型电脑应用,2024,40(6):223-225.

1黄川腾,蒲爽,唐迪,李青.基于关联规则挖掘算法Apriori的土木工程课程相关性分析[J].中国教育信息化,2020(23):55-58. 被引量：4
2戴鸿昊,史建云.基于语义标注的数据库元数据质量评估方法[J].计算机产品与流通,2020(11):178-178. 被引量：4
3丘秀桃.运用PBL项目式学习改进美术特长生英语话题写作教学[J].校园英语,2020(31):160-161.
4潘徐政,卢旭锋,张明珠,计效园,周建新,殷亚军,沈旭.单件小批量砂型铸造企业熔炼浇注炉次计划研究[J].铸造工程,2020,44(6):40-46.
5付春平,刘天宝.依托微信小程序开展大学生思想教育的研究[J].中外企业文化,2020(8):109-110. 被引量：1
6尹天露,高晓欢,王敏,张海芳,刘卫刚,朱庆华,刘志军.突发公共卫生事件中基层医疗机构物资保障决策支持系统研究[J].中国医院,2020,24(10):45-47. 被引量：5
7安帅奇.论刑事庭审中认罪认罚从宽制度的适用[J].河南工程学院学报（社会科学版）,2020,35(4):50-54. 被引量：1
8江静,邓伟洪.持续学习改进的人脸表情识别[J].中国图象图形学报,2020,25(11):2361-2369. 被引量：3
9张爱军,罗道文.把监督哨位顶到产业发展一线[J].廉政瞭望,2020(23):83-83.
10孙暖,曹小平,刘军.一种基于AP的三支聚类改进算法[J].四川职业技术学院学报,2020,30(6):150-155. 被引量：1

计算机应用研究

2021年第1期

浏览历史

内容加载中请稍等...

大型数据库中利用强化学习改进treap的关联规则挖掘算法被引量：10

参考文献9

二级参考文献38

共引文献70

同被引文献125

引证文献10

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

大型数据库中利用强化学习改进treap的关联规则挖掘算法 被引量：10

参考文献9

二级参考文献38

共引文献70

同被引文献125

引证文献10

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

大型数据库中利用强化学习改进treap的关联规则挖掘算法被引量：10