基于贝叶斯粗糙集的大数据频繁项挖掘技术被引量：3

Large Data Frequent Item Mining Technology Based on Bayesian Rough Set

下载PDF

导出

摘要对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。 The frequent itemsets on data mining is a key step of association rule mining, through frequent item mined effec?tively, it can improve the access efficiency of large quantities of data database. The rough set algorithm for mining frequent item sets in the traditional method on data mining using FP-Growth, scalability and fault tolerance is not good. Put forward a kind of data mining technology based on large Bayesian Rough set of frequent items, introducing the concept of suffix ta?ble, by constructing a suffix table, complete information remain frequent item sets. Construction of FP-Tree, the generation of closed frequent itemsets, calculate the sample density, and extract the regions of high density point set as the clustering center, constructed suffix table, according to the degree of support is divided into a plurality of sets, attribute of each reduc?tion set within the set of fusion, using Bayesian variable precision rough sets rough data improved data mining algorithm, simulation results show that the algorithm is not affected by the impact of variable parameters, high robustness, data mining is of high accuracy and short running time. The algorithm will have more wide prospect of application in the field of artifi?cial intelligence and data mining.

作者张本文

机构地区四川民族学院计算机科学系

出处《科技通报》北大核心 2015年第6期211-213,共3页 Bulletin of Science and Technology

基金四川省教育厅自然科学基金No.13ZA0136

关键词贝叶斯粗糙集频繁项挖掘大数据 Bayesian Rough Set frequent item mining large data

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1陆科达,万励,吴洁明.基于数据挖掘技术的网络安全事件预测研究[J].科技通报,2012,28(6):37-39. 被引量：14
2Dean J,Ghemawat S.MapReduce:simplified data process.ing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
3Li H,Wang Y,Zhang D,,et al. Pfp: parallel fp-growth forquery recommendation[C].//Proceedings of the 2008 ACMconference on Recommender systems,2008:107-114.
4Owen S,Anil,Dunning T,et al.Mahout in action [M].Man.ning,2011.
5Wang SQ,Yang YB,Gao Y,et al. MapReduce- basedClosed Frequent Itemset Mining with Efficient RedundancyFiltering[C]//Data Mining Workshops (ICDMW),2012IEEE 12th International Conference,2012: 449-453.

二级参考文献5

1纪祥敏,连一峰,许晓利,贾文臣.入侵检测技术的研究与进展[J].计算机仿真,2004,21(11):129-132. 被引量：9
2肖道举,马慧,陈晓苏.一种结构化的网络攻击建模方法[J].华中科技大学学报（自然科学版）,2006,34(2):70-72. 被引量：4
3Liu P., Zang W. Incentive-Based Modeling and Inference of Attacker Intent, Objectives and Strategies[J]. ACM Transac- tions on Information and Systems Security, 2005,56 (3): 283-298.
4陈萍,张莉华.基于混沌理论网络攻击频率预测研究[J].计算机仿真,2011,28(10):125-128. 被引量：1
5卢继军,黄刘生,吴树峰.基于攻击树的网络攻击建模方法[J].计算机工程与应用,2003,39(27):160-163. 被引量：20

共引文献13

1张志宏.多状态指数优化指导下的财务数据关键特征挖掘[J].电子科技,2013,26(12):144-147. 被引量：1
2李凤云.基于随机无线信号择优关联的灾区通信盲区车辆定位模型[J].科技通报,2013,29(11):180-183. 被引量：1
3苟格.物流企业长途运输司机的离职倾向预警分析[J].物流技术,2014,33(3):238-240. 被引量：1
4鲍建成.基于智能物联网的家居监控系统[J].科技通报,2014,30(2):41-43. 被引量：7
5雷明.基于单冲程频谱特征故障智能检测软件设计[J].科技通报,2014,30(2):44-46. 被引量：3
6李风芝.基于滑动窗口模型空间重组的网络流量检测[J].科技通报,2014,30(6):49-51.
7王春杰,朱保锋.基于信息浓缩粒子滤波的分布式网络数据库优化索引[J].软件导刊,2016,15(7):155-157.
8陆冰芳.数据挖掘算法在大数据安全防御中的应用与研究[J].通讯世界,2018,25(7):3-4. 被引量：3
9刘琦.基于BP神经网络的网络安全事件预测分析[J].福建电脑,2018,34(12):39-40. 被引量：1
10罗尚平,刘才铭.粒子群算法和SVM的网络入侵检测[J].现代电子技术,2017,40(10):31-34. 被引量：2

同被引文献36

1瞿彬彬,卢炎生.基于粗糙集的属性约简算法研究[J].华中科技大学学报（自然科学版）,2005,33(8):30-33. 被引量：33
2王小晟.粗糙集与灰色系统[J].计算机工程与应用,2006,42(31):31-33. 被引量：4
3沈晨鸣.基于粗糙集的数据挖掘属性约简算法研究[J].南京工程学院学报（自然科学版）,2007,5(1):30-34. 被引量：3
4蔡娜,张雪峰.基于贝叶斯粗糙集模型的属性约简[J].计算机工程,2007,33(24):46-48. 被引量：4
5汪传旭,柳鹏.国际干散货海运量预测系统的研究[J].上海海运学院学报,1997,18(2):82-88. 被引量：4
6韩敏,张俊杰,彭飞,肖正宇.一种基于多决策类的贝叶斯粗糙集模型[J].控制与决策,2009,24(11):1615-1619. 被引量：13
7华伟,祁云嵩,王芳.不完备目标信息系统中的可变精度粗糙集模型[J].江苏科技大学学报（自然科学版）,2009,23(6):531-534. 被引量：5
8陈昊,杨俊安,庄镇泉.变精度粗糙集的属性核和最小属性约简算法[J].计算机学报,2012,35(5):1011-1017. 被引量：68
9赵军,陈宸.一种基于二进制分辨矩阵的属性约简新算法[J].重庆邮电大学学报（自然科学版）,2012,24(4):490-494. 被引量：2
10范永辉,杨华龙,刘金霞.基于BEKK方差模型的干散货航运市场间波动溢出效应分析[J].数学的实践与认识,2012,42(23):18-24. 被引量：7

引证文献3

1韩楠,莫智文,舒畅.不完备贝叶斯决策信息系统的属性约简[J].四川师范大学学报（自然科学版）,2016,39(6):825-828. 被引量：1
2王宏智,高学东,赖媛媛.基于灰粗集属性知识简约算法的海运规则发现[J].统计与信息论坛,2017,32(1):107-113. 被引量：3
3王培,于章晗,李津平,许梦,李奇芳,项丽婷.浅谈粗糙集理论及其应用[J].菏泽学院学报,2020,42(2):6-10. 被引量：4

二级引证文献8

1侯娜,李战江,苏金梅,任星燕.基于灰色动态聚类-粗糙集的绿色资源环境评价指标构建模型[J].统计与信息论坛,2017,32(8):96-103. 被引量：13
2杨贵军,于洋.基于BIC的粗糙集择优和属性约简[J].统计与信息论坛,2018,33(3):3-9. 被引量：3
3令宝.基于属性约简算法的运动员伤病预警模型构建及仿真研究[J].自动化与仪器仪表,2018,0(9):24-27. 被引量：3
4周艳红,张迪,张强.基于单调信息度量的特定类属性约简[J].内江师范学院学报,2019,34(12):35-39. 被引量：1
5梁燕华,李凌烜,成燕峰,刘刚.基于AHP-粗糙集理论的冲击地压综合评价[J].中国新技术新产品,2021(15):1-3. 被引量：1
6黄加增.基于粗糙集的通信信号识别方法[J].数字通信世界,2021(11):70-71.
7刘财辉,凌敏,钱进.特征函数描述下的多粒度覆盖粗糙集及其不确定性度量[J].昆明理工大学学报（自然科学版）,2022,47(3):51-59.
8王标,卫红权,王凯,刘树新,江昊聪.基于粗糙集的不完备谣言信息系统的知识获取与决策[J].信息安全学报,2024,9(2):19-35.

1李艳荣.粗糙集属性约简算法在图像分类研究的应用[J].电脑知识与技术,2009,5(7X):6076-6080.
2李艳荣.基于贝叶斯粗糙集属性约简算法在图像分类中的应用[J].电脑知识与技术（过刊）,2009,15(4X):4516-4517.
3李艳荣.基于贝叶斯粗糙集的图像分类方法的应用[J].电脑知识与技术（过刊）,2009,15(4X):4527-4528.
4朱颢东,钟勇.基于贝叶斯粗糙集的文本特征选择方法[J].河南师范大学学报（自然科学版）,2009,37(4):31-35. 被引量：3
5韩敏,张俊杰,彭飞,肖正宇.一种基于多决策类的贝叶斯粗糙集模型[J].控制与决策,2009,24(11):1615-1619. 被引量：13
6陈可,张小强,徐选华.基于改进贝叶斯粗糙集和证据理论的决策信息融合方法[J].计算机应用研究,2014,31(9):2625-2628. 被引量：3
7王虹,张文修.关于贝叶斯粗糙集模型的知识约简[J].计算机科学,2005,32(11):150-151. 被引量：3
8施志坚,王华伟.基于改进信息融合的航空发动机状态评估方法[J].航空计算技术,2015,45(2):26-30. 被引量：2
9余永佳,薛颖.贝叶斯粗糙集云数据深度融合算法[J].科技通报,2015,31(10):154-156.
10韩敏,王心哲,李洋,童年.基于贝叶斯粗糙集和混合专家模型的CBR系统[J].控制与决策,2013,28(1):157-160. 被引量：6

科技通报

2015年第6期

浏览历史

内容加载中请稍等...

基于贝叶斯粗糙集的大数据频繁项挖掘技术被引量：3

参考文献5

二级参考文献5

共引文献13

同被引文献36

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于贝叶斯粗糙集的大数据频繁项挖掘技术 被引量：3

参考文献5

二级参考文献5

共引文献13

同被引文献36

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于贝叶斯粗糙集的大数据频繁项挖掘技术被引量：3