-
题名基于最小且非重叠发生的频繁闭情节挖掘
被引量:6
- 1
-
-
作者
朱辉生
汪卫
施伯乐
-
机构
泰州师范高等专科学校
复旦大学计算机科学技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第4期852-860,共9页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2005CB321905)
国家自然科学基金项目(61003001
61103009)
-
文摘
事件序列上的频繁闭情节挖掘是一个重要课题,现有的研究基于最小发生的支持度定义和广度优先的搜索策略,不可避免地导致了情节发生的"过计数"和大量候选情节的产生问题,因此,基于最小且非重叠发生的支持度定义和深度优先的搜索策略,提出了一个事件序列上的频繁闭情节挖掘算法FCEMiner,在此基础上,利用特殊前向扩展的非闭一致性避免了冗余的闭合性检查,缩小了频繁闭情节的搜索空间.理论分析和实验评估证明FCEMiner能够有效地发现事件序列上的频繁闭情节.
-
关键词
事件序列
频繁闭情节
最小且非重叠发生
深度优先
数据挖掘
-
Keywords
event sequence
frequent closed episode
minimal and non overlapping occurrence
depth-first
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于规则前件发生树匹配的数据流预测方法研究
被引量:1
- 2
-
-
作者
尤涛
李廷峰
杜承烈
钟冬
朱怡安
-
机构
西北工业大学计算机学院
-
出处
《通信学报》
EI
CSCD
北大核心
2017年第12期98-108,共11页
-
基金
2017航空科学重点基金资助项目
2016复杂产品智能制造系统技术国家重点实验开放研究基金资助项目~~
-
文摘
现有基于规则匹配的数据流预测算法存在前件发生定义不准确、前件相关性未考虑、预测结果描述不严谨等不足,造成预测过程效率较低、精度不高等问题。提出基于前件发生树的概率叠加预测算法,定义区间最小非重叠发生,避免前件的错误匹配;通过前件的合并构建前件发生树,提高前件发生的搜索效率;基于概率叠加的思想计算后件的发生区间和发生概率,使预测精度进一步提高。理论分析和实验结果表明,该算法具有较高的时空效率和预测精度。
-
关键词
数据流
情节规则
区间最小非重叠发生
前件发生树
概率叠加预测
-
Keywords
data stream, episode rule, interval minimal non-overlapping occurrence, antecedent occurrence tree, prediction based on superposed probability
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于情节规则匹配的数据流预测
被引量:2
- 3
-
-
作者
朱辉生
汪卫
施伯乐
-
机构
泰州师范高等专科学校
复旦大学计算机科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第5期1183-1194,共12页
-
基金
国家自然科学基金(61003001
61103009)
国家重点基础研究发展计划(973)(2005CB321905)
-
文摘
提出了一种数据流预测算法Predictor.该算法为每个待匹配的一般形式的情节规则分别使用了一个自动机,通过单遍扫描数据流来同时跟踪这些自动机的状态变迁,以搜索每个规则前件最近的最小且非重叠发生.这样不仅将无界的数据流映射到有限的状态空间,而且避免了对情节规则的过于匹配.另外,算法预测的结果是未来多个情节的发生区间和发生概率.理论分析和实验评估表明,Predictor具有较高的预测效率和预测精度.
-
关键词
数据流
情节规则
最近的最小且非重叠发生
预测
-
Keywords
data stream
episode rule
the latest minimal and non-overlapping occurrence
prediction
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于混合EHMM模型的数据流预测
被引量:1
- 4
-
-
作者
丁勇
朱辉生
曹红根
-
机构
南京理工大学泰州科技学院
泰州学院计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2014年第S1期391-393,413,共4页
-
基金
国家自然科学基金项目(61003001
61103009)资助
-
文摘
首先提出一种改进的算法NONEPI++,用于挖掘事件序列上非重叠发生的频繁情节;然后将每个频繁情节表示为相应的情节隐马尔可夫模型EHMM,并通过最大期望算法计算模型的混合系数,从而生成一个基于历史数据流的混合模型;最后,基于该混合模型预测目标事件类型出现的概率。实验表明,混合EHMM模型能有效地预测数据流。
-
关键词
事件序列
频繁情节
非重叠发生
隐马尔可夫模型
-
Keywords
Event sequence,Frequent episode,Non-overlapped occurrence,Hidden Markov models
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于前缀共享树的频繁情节挖掘算法
- 5
-
-
作者
丁勇
朱辉生
高广银
-
机构
南京理工大学泰州科技学院
泰州学院计算机科学与技术学院
-
出处
《科学技术与工程》
北大核心
2014年第28期231-234,246,共5页
-
基金
国家自然科学基金项目(61003001,61103009)资助
-
文摘
经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁情节压缩到前缀共享树中,通过动态维护前缀共享树来发现所有的频繁情节。该算法只需扫描事件序列一次,大大提高了频繁情节挖掘的效率。实验证明,PST_NONEPI算法能有效地挖掘频繁情节。
-
关键词
事件序列
频繁情节
最小且非重叠发生
前缀共享树
-
Keywords
event sequence
frequent episode
minimal and non-overlapped occurrence
prefix shared tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名事件序列上的频繁情节挖掘算法
- 6
-
-
作者
丁勇
王云
李丛
-
机构
南京理工大学泰州科技学院
-
出处
《计算机系统应用》
2014年第12期202-205,共4页
-
文摘
事件序列上的频繁情节挖掘是时序数据挖掘领域的热点之一,基于非重叠发生的支持度定义,提出一个频繁情节挖掘算法NONEPI++,该算法首先通过情节串接产生候选情节,然后通过预剪枝和计算情节发生的时间戳来产生频繁情节.算法只需扫描事件序列一次,大大提高了情节挖掘的效率.实验证明,NONEPI++算法能有效地挖掘频繁情节.
-
关键词
事件序列
频繁情节
非重叠发生
-
Keywords
event sequence
frequent episode
non-overlapped occurrence
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-