-
题名基于前缀共享树的频繁情节挖掘算法
- 1
-
-
作者
丁勇
朱辉生
高广银
-
机构
南京理工大学泰州科技学院
泰州学院计算机科学与技术学院
-
出处
《科学技术与工程》
北大核心
2014年第28期231-234,246,共5页
-
基金
国家自然科学基金项目(61003001,61103009)资助
-
文摘
经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁情节压缩到前缀共享树中,通过动态维护前缀共享树来发现所有的频繁情节。该算法只需扫描事件序列一次,大大提高了频繁情节挖掘的效率。实验证明,PST_NONEPI算法能有效地挖掘频繁情节。
-
关键词
事件序列
频繁情节
最小且非重叠发生
前缀共享树
-
Keywords
event sequence
frequent episode
minimal and non-overlapped occurrence
prefix shared tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于Hadoop的关联规则挖掘算法
被引量:7
- 2
-
-
作者
丁勇
朱长水
武玉艳
-
机构
南京理工大学泰州科技学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第B11期409-411,416,共4页
-
基金
2015江苏省高校自然科学研究面上项目(15KJB520016)
2017年度江苏省高校"青蓝工程"资助
-
文摘
传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算节点定义一个前缀共享树,通过递归调用的方式将事务T生成的候选项集逐层压缩到前缀共享树(PST)中。然后广度遍历PST,逐层将每个节点对应的〈key,value〉作为map函数的输入,并由MapReduce框架自动按照key值进行聚集。最后调用reduce函数对多个任务的处理结果进行汇总,得到满足最小支持度阈值的频繁项集。算法只使用两个MapReduce任务,且PST按照key值排序便于Mapper端的shuffle操作,提高了运行效率。
-
关键词
关联规则
HADOOP
MAPREDUCE
前缀共享树
-
Keywords
Association rule
Hadoop
MapReduce
Prefix shared tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数字图书馆下的文献阅读智能推荐
- 3
-
-
作者
朱辉生
陈琳
张禹
陆宇
-
机构
泰州学院计算机科学与技术学院
-
出处
《软件工程与应用》
2018年第5期261-272,共12页
-
基金
江苏省自然科学基金(BK20141307)
江苏省“333工程”基金(BRA2015212)
+1 种基金
教育部“云数融合科教创新”基金(2017B06109)
江苏省“大创”基金(201712917007Y)资助。
-
文摘
数字图书馆以其信息容量大、传输速度快、时空限制少等优势,已成为读者阅读文献的主流平台。如何向读者提供导向性强、个性化好的服务,是数字图书馆向智慧图书馆转变的关键。鉴于此,提出一种文献阅读智能推荐算法。该算法只需单遍扫描文献阅读流,以深度优先搜索策略来挖掘频繁情节,以共享前缀树来存储频繁情节,以情节单调性来压缩搜索空间。实验表明,与经典算法相比,所提算法具有较好的时空性能和较高的挖掘质量,挖掘结果能够揭示读者的阅读习惯和预测读者的阅读倾向,从而有助于数字图书馆提高文献资源的利用率并向读者提供更好的个性化服务。
-
关键词
数字图书馆
智能推荐
频繁情节
深度优先搜索
共享前缀树
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名关联规则挖掘在证券业个性化服务中的应用
被引量:1
- 4
-
-
作者
徐晓峰
黄林鹏
顾锡康
-
机构
上海交通大学计算机科学与工程系
东吴证券有限责任公司
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第19期214-216,共3页
-
基金
国家"863"计划基金资助项目(2001AA113160)
-
文摘
提出了一种适用于证券业交易数据库挖掘的频繁模式链表关联规则挖掘算法,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL-growth算法通过直接排列出链路中的频项组合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。
-
关键词
关联规则
共享前缀交易树
频繁模式链表
频繁模式链表关联规则算法
时间属性
证券
-
Keywords
Association rule
STP-tree
FP-link
FPL-growth
Time-property
Stock
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关联规则挖掘在证券业中的应用
被引量:1
- 5
-
-
作者
徐晓峰
黄林鹏
顾锡康
-
机构
上海交通大学计算机科学与工程系
东吴证券有限责任公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期6-7,96,共3页
-
基金
国家"863"计划基金资助项目(2001AA113160)
-
文摘
基于证券业急需一种能帮助其提高个性化服务质量的系统,该文提出了一种适用干证券业单交易项交易数据库挖掘的频繁模式链表 关联规则挖掘算法,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL-growth算法通过直接排列出链路中的频项组 合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。
-
关键词
关联规则
共享前缀交易树
频繁模式链表
频繁模式链表关联规则算法
时间属性
证券
-
Keywords
Association rule
STP-trce
FP-link
FPL-growth
Time-property
Stock
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于模式匹配的目标轨迹预测方法
- 6
-
-
作者
赖群
锦业余
姜绍艳
李莉
-
机构
广东电网公司云浮供电局
广东电网公司中山供电局
北京邮电大学网络与交换技术国家重点实验室
-
出处
《无线通信》
2013年第6期123-128,共6页
-
文摘
本文在目标轨迹预测中采用了数据挖掘的方法,提出了一个具体的基于移动模式匹配的目标轨迹预测算法。该方法通过不断挖掘历史移动轨迹来构造前缀共享树的方法挖掘出频繁移动模式,之后通过模式匹配预测出目标的移动轨迹。仿真结果表明该算法的时间消耗和空间消耗较小,同时具有很高的预测准确性。
-
关键词
数据挖掘
目标轨迹预测
移动模式匹配
前缀共享树
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-