数据点位置低延时智能挖掘方法与仿真

Intelligent Mining Method and Simulation of Data Point Location with Low Delay

下载PDF

导出

摘要当前数据位置挖掘方法无法获取全局频繁项目集,导致上述方法存在效率低、时延长等问题。为此提出基于并行FPGrowth算法的数据点位置智能挖掘方法。将并行FP-Growth算法与MAP/Reduce结合,得到优化后的FPPM算法。利用FPPM算法的reducer函数计算事务数据集局部频繁项目集,并将其整合得到全局频繁项目集。计算每个项目集属性,利用增量分类法筛选出最佳属性,统计每个属性出现的概率,构建决策分支树,完成数据点位置的挖掘。以CPU占用率、挖掘时延、信息熵以及可扩展性为测试指标设计仿真。实验结果验证了所提方法在确保较低挖掘时延前提下实现了高效率挖掘,并具有理想的可扩展性。 Currently,some methods of mining data location are unable to obtain the global frequent itemsets,leading to low efficiency and high time delay.Therefore,an intelligent approach of mining data point location based on a parallel FP-Growth algorithm was proposed.Firstly,we combined the parallel FP-Growth algorithm with MAP/Reduce to obtain an optimized FPPM algorithm.Secondly,we used the reducer functions of the FPPM algorithm to calculate the local frequent item sets in the transaction data set,and then integrated them to get a global frequent item set.Thirdly,we calculated the attribute of every item set and screened out the best attributes by incremental taxonomy.Moreover,we calculated the probability of occurrence of each attribute and constructed the decision tree,thus mining the location of the data point.Simulation experiments were based on some indexes such as CPU usage,mining delay,information entropy,and scalability.Experimental results prove that the proposed method can achieve high-efficient mining on the premise of low delay and has good scalability.

作者唐雯炜李志敏 TANG Wen-wei;LI Zhi-min(Information Technology Center,Zhejiang Chinese Medical University,Hangzhou Zhejiang 310053,China)

机构地区浙江中医药大学信息技术中心

出处《计算机仿真》北大核心 2022年第8期519-523,共5页 Computer Simulation

关键词算法项目集挖掘时延数据点位置增量分类 Algorithm Item set Mining delay Location of data point Incremental classification

分类号 TN325 [电子电信—物理电子学]

引文网络
相关文献

参考文献12

1赵晓华.基于人工智能裁决的云网络信息数据挖掘算法[J].信息技术,2018,42(9):151-155. 被引量：5
2韩高峰.智能网络系统低匹配度数据深度挖掘算法研究[J].宁夏师范学院学报,2020,41(4):82-88. 被引量：1
3刘莉萍,章新友,牛晓录,郭永坤,丁亮.基于Spark的并行关联规则挖掘算法研究综述[J].计算机工程与应用,2019,55(9):1-9. 被引量：29
4吕国,肖瑞雪,白振荣,孟凡兴.大数据挖掘中的MapReduce并行聚类优化算法研究[J].现代电子技术,2019,42(11):161-164. 被引量：21
5张磐,丁泠允,姜宁,凌万水,丁一.基于支持度-置信度-提升度的配网自动化系统数据挖掘算法及应用*#[J].电测与仪表,2019,56(10):62-68. 被引量：52
6程远国,唐文杰.军事情报监视与侦察系统中一种目标同现模式挖掘算法[J].海军工程大学学报,2019,31(6):56-60. 被引量：4
7胡向阳,张巍.基于大数据的侦查讯问文本数据挖掘与分析[J].中国人民公安大学学报（社会科学版）,2019,35(6):35-43. 被引量：13
8李玲,印莹,赵宇海,王国仁,董祥军.基于解耦概要图的大规模图数据高效分布式挖掘算法[J].计算机学报,2020,43(7):1183-1198. 被引量：5
9黄敏,毛锋,钱宇翔.基于出租车司机经验的约束深度强化学习算法路径挖掘[J].计算机应用研究,2020,37(5):1298-1302. 被引量：6
10王宁,韩京宇,王尚凌,万杨兰.一种基于元路径拥塞模式挖掘的移动对象位置预测方法[J].南京航空航天大学学报,2019,51(5):675-680. 被引量：1

二级参考文献87

1施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
2孙在华.对提高预审办案深挖犯罪效能的途径和方法的探讨[J].浙江警察学院学报,2004,16(6):30-32. 被引量：1
3余伟民,俞如平,汤文全,徐世土,汤劲松.网上作战原理探析[J].浙江警察学院学报,2005,17(4):71-76. 被引量：7
4宋卫林,徐惠民.基于最大频繁项目序列集挖掘DMFIA算法的改进[J].计算机工程与设计,2007,28(7):1493-1496. 被引量：1
5宋长新,马克.改进的Eclat数据挖掘算法的研究[J].微计算机信息,2008,24(24):92-94. 被引量：17
6唐炉亮,常晓猛,李清泉.出租车经验知识建模与路径规划算法[J].测绘学报,2010,39(4):404-409. 被引量：25
7赫凛冽.电子问答笔录在公安实践中应用的思考[J].中国人民公安大学学报（自然科学版）,2011,17(2):81-84. 被引量：3
8朱锦山,丛爱建,许俊.基于决策树的雷达型号识别方法研究[J].电子世界,2012(5):113-115. 被引量：1
9马忠红.论刑事案件的构成要素[J].中国人民公安大学学报（社会科学版）,2012,28(5):91-99. 被引量：35
10傅颖勋,罗圣美,舒继武.安全云存储系统与关键技术综述[J].计算机研究与发展,2013,50(1):136-145. 被引量：175

共引文献142

1邹杰军,王欣,石俊豪,兰卓,方宇,张翀,谢文波,沈玲珍.面向大图的Top-Rank-K频繁模式挖掘算法[J].南京大学学报（自然科学版）,2024,60(1):38-52.
2夏正龙,姚蓉,朱亮,钟艳雯.基于Spark的探空逆温识别算法实现[J].湖北农业科学,2021,60(S01):335-339. 被引量：1
3丁秀桥.对护生实习期心理状况与实习效果的相关研究[J].健康心理学杂志,2000,8(3):346-347. 被引量：2
4姬忠礼,丁富新,孟祥波,时铭显.陶瓷过滤器滤管外瞬态流场[J].化工学报,2000,51(2):165-168. 被引量：8
5陈建煊.利益相关者管理[J].经济管理,2000,26(4):58-58. 被引量：3
6李银碧.移动通信网络优化中数据挖掘技术的应用[J].通信技术,2019,52(4):912-916. 被引量：4
7杨海霞,李晨宇,章玲,卜玉华.基于FP-tree算法的评价指标关联信息挖掘和指标重要程度确定[J].系统工程,2019,37(3):141-150. 被引量：6
8罗铮.基于人工智能的住房公积金客服问答系统研究[J].信息技术,2019,43(9):121-124. 被引量：1
9张婷.基于Apache Spark的移动APP用户访问路径分析[J].海南大学学报（自然科学版）,2019,37(3):209-218. 被引量：1
10李军,刘举庆,游林,俞艳,张晓盼,董恒.时空大数据支持的土地储备智能决策体系与应用研究[J].中国土地科学,2019,33(9):111-120. 被引量：15

1刘凌云,钱辉,邢红杰,董春茹,张峰.一种基于Q-学习算法的增量分类模型[J].计算机科学,2020,47(8):171-177. 被引量：4
2曾俊义.二分搜索算法在全局频繁项目集求解中的应用[J].现代计算机,2019,25(19):24-27.
3魏秀参,徐书林,安鹏,杨健.面向增量分类的多示例学习[J].计算机研究与发展,2022,59(8):1723-1731. 被引量：1
4王艳西,谢永乐.农村宅基地有偿使用市场化的经济分析与路径构建[J].农村经济,2022(2):53-61. 被引量：3
5程红阳,叶青.基于数据挖掘的学习效果评估算法设计[J].电子设计工程,2022,30(19):15-18. 被引量：1
6张娜娜.造纸流程可视化虚拟现实平台构建[J].造纸科学与技术,2022,41(3):39-44. 被引量：1
7张冰洁.基于B/S模式的乘务英语课程线上互动教学系统[J].自动化技术与应用,2022,41(9):150-152. 被引量：1
8黄建平,杨少杰,余建,陈浩.基于分布式区块链技术的供应链数据平台架构设计[J].电子设计工程,2022,30(17):45-49. 被引量：1
9陈浩,杨芫,徐明伟,裴丹,尤艺霖.支持多模态网络的可扩展异构服务功能链并行编排部署系统[J].通信学报,2022,43(9):1-11. 被引量：1
10钱昭勇,曹裕华,史增凯,张雷.关联规则算法在卫星定位精度考核中的比较分析[J].工程与试验,2022,62(3):30-34.

计算机仿真

2022年第8期

浏览历史

内容加载中请稍等...

数据点位置低延时智能挖掘方法与仿真

参考文献12

二级参考文献87

共引文献142

相关作者

相关机构

相关主题

浏览历史