-
题名面向紧邻关系重发现的事件日志采样方法及其应用
- 1
-
-
作者
苏轩
刘聪
闻立杰
孟晓亮
李彩虹
曾庆田
-
机构
山东理工大学计算机科学与技术学院
山东科技大学计算机科学与工程学院
清华大学软件学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2024年第8期2832-2843,共12页
-
基金
国家自然科学基金资助项目(62472264)
山东省泰山学者工程专项基金资助项目(ts20190936,tsqn201909109)
+1 种基金
山东省自然科学基金优秀青年基金资助项目(No.ZR2021YQ45)
山东省高等学校青创科技计划创新团队项目(2021KJ031)。
-
文摘
事件日志采样作为近年来流程挖掘领域一个新的研究热点,旨在提高流程挖掘任务的效率,如模型发现、合规性检查、流程预测等。然而目前已有的采样方法不能很好地保证挖掘模型的质量,且针对大规模事件日志的采样效率低。任务紧邻关系作为事件日志中行为描述的基本单元,在各类流程挖掘任务中起到了关键作用。鉴于此,提出了一个通用的面向紧邻关系重发现的事件日志采样方法,该方法可保证紧邻关系的重发现性。为了验证该采样方法的有效性,将其应用于提高已有模型挖掘算法的效率,为了对挖掘模型质量定量评估,提出了基于流程树的模型相似度方法。所提出的采样方法已在开源流程挖掘工具平台ProM6和PM4PY实现,基于12个公开事件日志数据集,将所提出的面向紧邻关系重发现的采样方法与已有方法从模型挖掘质量方面进行了定量比较,实验结果表明所提方法可以在保证模型质量的前提下,大幅提高模型发现效率。
-
关键词
事件日志采样
紧邻关系重发现
质量评估
模型相似度
-
Keywords
event log sampling
directly-follows relation rediscoverbility
quality measure
model similarity
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-