基于FP-growth关联规则的图书馆数据快速挖掘算法研究被引量：15

Research on Library Data Fast Mining Algorithm Based on FP-growth Association Rules

下载PDF

导出

摘要作为一种模糊关联规则挖掘算法,FP-growth算法在执行效率上明显优于Apriori算法。但是由于模糊属性的不足和空间复杂度较大,导致FP-growth算法在处理大型事务数据库,例如图书馆数据库时,无法实现有效的多层关联规则挖掘。因此,提出一种改进的FP-growth关联规则算法,能够快速向读者进行个性化图书推荐。首先,该算法把大型图书事务数据库根据首项的事务,划分为若干子数据库,并构建相应的子FP-tree结构;然后,采用实时过滤掉层次树中不是频繁项的父项来缩小扫描空间。实验结果表明:相比Apriori算法和标准FP-growth算法,提出的改进FP-growth关联规则算法在运行效率方面有明显提升,为图书的推荐工作提供了科学依据。 As a fuzzy association rule mining algorithm,the FP-growth algorithm is significantly better than the Apriori algorithm in execution efficiency.However,due to the lack of fuzzy attributes and large space complexity,the FP-growth algorithm cannot implement efficient multi-level association rule mining when dealing with large transaction databases,such as library databases.Therefore,an improved FP-growth association rule algorithm is proposed,which can quickly make personalized book recommendation to readers.First,the algorithm divides the large book transaction database into several sub-databases according to the first transaction,and constructs the corresponding sub-FP-tree structure.Then,the scan space is narrowed down by filtering out the parent steps of the hierarchy tree that are not frequent items in real time.The experimental results show that compared with the Apriori algorithm and the standard FP-growth algorithm,the proposed improved FP-growth association rule algorithm has a significant improvement in operational efficiency,which provides a scientific basis for the recommendation work of the book.

作者文芳黄慧玲李腾达王佳斌 WEN Fang;HUANG Huiling;LI Tengda;WANG Jiabin(Nanchang Normal University,Nanchang 330032,China;College of Engineering,Huaqiao University,Quanzhou 362021,China)

机构地区南昌师范学院华侨大学工学院

出处《重庆理工大学学报（自然科学）》 CAS 北大核心 2020年第6期189-194,共6页 Journal of Chongqing University of Technology：Natural Science

基金江西省社会科学规划项目“面向MOOCs环境高校图书馆的功能定位研究”(15YD006) 厦门市科技局产学研协同创新项目(3502Z20173046)。

关键词数据挖掘图书馆模糊关联规则 APRIORI FP-GROWTH 运行效率 data mining library fuzzy association rules Apriori FP-growth operational efficiency

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1王娜,岳俊英.基于关联规则的高校图书信息数据挖掘[J].信息系统工程,2014(2):153-154. 被引量：2
2尚晓丽,包向辉.分布式空间数据库中有效数据频繁项实时检测[J].科学技术与工程,2018,18(19):224-229. 被引量：4
3徐开勇,龚雪容,成茂才.基于改进Apriori算法的审计日志关联规则挖掘[J].计算机应用,2016,36(7):1847-1851. 被引量：49

二级参考文献39

1徐成香.基于数据挖掘技术的学生信息系统开发[J].硅谷,2009,2(16). 被引量：1
2毕建欣,张岐山.关联规则挖掘算法综述[J].中国工程科学,2005,7(4):88-94. 被引量：51
3丁丽萍,周博文,王永吉.基于安全操作系统的电子证据获取与存储[J].软件学报,2007,18(7):1715-1729. 被引量：8
4柴晟,成飏,李学锋.基于改进Apriori算法的评教系统应用研究[J].微计算机信息,2007,23(05X):218-220. 被引量：5
5MORADI M, KEYVANPOUR M R. An analytical review of XML association rules mining [ J]. Artificial Intelligence Review, 2015, 43(2) : 277 -300.
6SONG S J, KIM E H, KIM H G, et al. Query-based association rule mining supporting user perspective [ J]. Computing, 2011, 93 (1):1-25.
7AGRAWAL R, SRIKANT R. Fast algorithms for mining associationrules [ C]// Proceedings of the 20th International Conference on Very Large Data Bases. San Francisco, CA: Morgan Kaufmann, 1994:21-30.
8AGRAWAL R, IMIELINSKI T SWAMI A. Mining association rules between sets of items in large databases [ J]. ACM SIGMOD Re- cord, 1993, 22(2): 207-216.
9HAN J, PEI J, YIN Y. Mining frequent patterns without candidate generation [J]. ACM SIGMOD Record, 2000, 29(2): 1 -12.
10EL-HAJJ M, ZAIANE O R. COFI approach for mining frequent itemsets revisited [ C]// Proceedings of the 2004 ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Dis- covery. New York: ACM, 2004:70-75.

共引文献52

1罗奇,徐红丽,余国清.多防区光纤网络入侵的快速模糊判定研究[J].激光杂志,2016,37(12):137-140.
2何天荣.基于模糊数学的海量数据特征定位研究[J].内蒙古师范大学学报（自然科学汉文版）,2017,46(2):178-181. 被引量：1
3陈衡,刘玉文.基于二维数组和十字链表的Apriori算法[J].德州学院学报,2017,33(2):63-67. 被引量：1
4邹元君,姜彤伟.基于改进关联规则的图像挖掘技术研究[J].现代电子技术,2017,40(16):109-111. 被引量：2
5吕峰,蒋旭东,杨群,张雍,杨宏.基于改进关联规则的医疗关键数据定位技术研究[J].自动化与仪器仪表,2017(11):141-142. 被引量：3
6唐琳,付达杰.大数据审计系统及其关键技术[J].西部财会,2018(1):71-74. 被引量：2
7GUO Fengxia.Computer-based Test of Spoken English Translation Accuracy Evaluation System with Wireless Mobile Terminal[J].International English Education Research,2018(1):17-20.
8王有元,周立玮,梁玄鸿,刘航,辜超,杨祎.基于关联规则分析的电力变压器故障马尔科夫预测模型[J].高电压技术,2018,44(4):1051-1058. 被引量：29
9张滨.不平衡数据挖掘在分布式数据库中的应用[J].控制工程,2018,25(7):1179-1183. 被引量：11
10温荣坤.基于偏微积分分类数学模型的关联挖掘改进技术[J].现代电子技术,2018,41(13):95-99. 被引量：1

同被引文献167

1梁天恺,曾碧,刘建圻.基于FP-Growth的智能家居用户时序关联操控习惯挖掘方法[J].计算机应用研究,2020,37(2):385-389. 被引量：9
2汪赫瑜,夏航,任建华.混合深层协同过滤的SVD++推荐方法[J].辽宁工程技术大学学报（自然科学版）,2020(6):524-532. 被引量：2
3刘双跃,杨蕾,彭丽.基于改进Apriori算法的煤矿物态隐患系统设计与应用[J].煤炭技术,2015,34(4):318-320. 被引量：6
4张雅琴.关联规则挖掘算法的设计[J].山西电子技术,2005(3):10-12. 被引量：2
5李璐璐.基于数据挖掘技术的信息服务研究及系统模型设计[J].大学图书情报学刊,2008,26(4):46-48. 被引量：10
6陈全.事故致因因素和危险源理论分析[J].中国安全科学学报,2009,19(10):67-71. 被引量：101
7金正昆.西装的选择与搭配[J].新湘评论,2010(8):44-45. 被引量：1
8林郎碟,王灿辉.Apriori算法在图书推荐服务中的应用与研究[J].计算机技术与发展,2011,21(5):22-24. 被引量：32
9邢昕,廖永德,唐和孝,陈广,具晟,游良琨.肺癌的性别差异及机制[J].中国肺癌杂志,2011,14(7):625-630. 被引量：23
10冯研,王馨.国内图书馆数据挖掘技术实践应用进展分析[J].图书馆学研究（应用版）,2011(10):2-4. 被引量：11

引证文献15

1郝成亮,刘超,刘洪波,臧洪睿,王宇.信息系统的数据库指标多维度异常发现算法分析[J].电脑知识与技术,2020,16(35):18-20. 被引量：3
2柏万.基于数据挖掘技术的图书管理系统研究[J].信息与电脑,2021,33(5):22-24. 被引量：1
3杨宇环,张开生.融合FP-Growth和RBM的图书推荐算法研究[J].陕西科技大学学报,2021,39(4):156-160. 被引量：4
4余飞娅,叶文波.基于FP-Growth算法的计量主站告警分析研究[J].电气自动化,2021,43(6):30-32.
5李华群.基于VOSviewer的关联规则在图书馆应用中的分析[J].信息记录材料,2021,22(12):182-185. 被引量：1
6李华群.基于改进Apriori算法在图书馆数据挖掘中应用分析[J].内蒙古科技与经济,2021(24):66-68. 被引量：4
7王晓东,孙安琪,赵托亚,李佳欣,吴雅琴.肺癌患者检验项目数据可视化及关联分析[J].医学信息,2022,35(4):20-23.
8牟庆泉,丁小兵,刘志钢,吴先源.基于地铁运营日志文本挖掘的危险源辨识算法研究[J].中国安全生产科学技术,2022,18(3):204-210. 被引量：5
9赵鑫,毋涛.改进FP-growth融合K-means算法的西装定制搭配方法[J].计算机系统应用,2022,31(6):368-375.
10高飞.基于hadoop平台的数据挖掘算法实证研究[J].广西广播电视大学学报,2022,33(6):24-28.

二级引证文献23

1谢妙,邓育林,吕洁.基于深度受限玻尔兹曼机的个性化推荐算法[J].数据采集与处理,2022,37(2):456-462. 被引量：5
2王健.基于融合密度聚类综合算法的工业经济数据库异常信息检测[J].现代工业经济和信息化,2022,12(5):95-97.
3严鑫平,柳炳祥,胡健.基于Apriori算法的国家宏观数据分析[J].信息与电脑,2022,34(8):61-63.
4陈帜,张文德,刘田.基于图卷积神经网络的图书推荐方法研究[J].情报探索,2022(10):1-5. 被引量：2
5贾辉,孙强.基于KNN算法的医院信息系统异常行为检测研究[J].网络安全技术与应用,2022(10):41-43. 被引量：2
6张佳佳,章宜玉.基于数据挖掘的图书推荐系统的分析与设计[J].信息记录材料,2022,23(9):237-239.
7徐秀芳,徐丹妍,徐森,郭乃瑄,许贺洋.一种结合谱聚类与关联规则的轴承故障诊断方法[J].计算机测量与控制,2023,31(1):51-58.
8高飞.基于hadoop平台的数据挖掘算法实证研究[J].广西广播电视大学学报,2022,33(6):24-28.
9秦国宾.融合多源信息的高校智能图书推荐算法[J].信息与电脑,2022,34(20):94-96.
10席永涛,李雪丹,付姗姗,严利鑫.基于有序Probit模型的铁路险兆事件影响因素识别研究[J].中国安全生产科学技术,2023,19(2):203-210.

1王红,郭静,王阳.航空安全事件关联分析方法研究[J].安全与环境学报,2020,20(2):602-609. 被引量：4
2熊才权,陈曦.基于FP-Growth的社交好友推荐方法研究[J].湖北工业大学学报,2020,35(1):33-37. 被引量：1
3岳书凝,邵波,王健.《基于FP-Growth关联规则算法的多因子打分法模型因子的选择与赋权研究》[J].现代营销（上）,2020(3):88-89.
4俞奕.基于用户画像的个性化图书推荐研究[J].办公室业务,2020,0(1):158-159. 被引量：3
5格特·德鲁,杰夫·波特,杨建(译),秦波(译).相关者商议:在普遍认同和积极的规划环境中处理可持续发展模糊性的方法[J].公共管理与政策评论,2019,8(6):71-79.
6乔冉,闫江毓,唐良瑞.基于多维高斯的无线传感器网络定位算法[J].计算机工程与应用,2019,55(23):99-104. 被引量：2
7俞奕,姚纽蒙.基于协同过滤的个性化图书推荐方法研究——以武汉科技大学图书馆为例[J].高校图书情报论坛,2019,18(4):17-22.
8陈宇,孙枭坤.政策模糊视阈下试点政策执行机制研究——基于低碳城市试点政策的案例分析[J].求实,2020,0(2):46-64. 被引量：30
9王锐,常锴,符国浩,王世峰,徐熙平,王作斌.单线激光雷达与GNSS/INS的空间重构[J].光学精密工程,2020,28(4):851-858. 被引量：10
10刘玥波.改进的Apriori算法在个性化推荐中的应用[J].通讯世界,2020,27(6):19-20. 被引量：2

重庆理工大学学报（自然科学）

2020年第6期

浏览历史

内容加载中请稍等...

基于FP-growth关联规则的图书馆数据快速挖掘算法研究被引量：15

参考文献3

二级参考文献39

共引文献52

同被引文献167

引证文献15

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于FP-growth关联规则的图书馆数据快速挖掘算法研究 被引量：15

参考文献3

二级参考文献39

共引文献52

同被引文献167

引证文献15

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于FP-growth关联规则的图书馆数据快速挖掘算法研究被引量：15