-
题名面向紧邻关系重发现的事件日志采样方法及其应用
- 1
-
-
作者
苏轩
刘聪
闻立杰
孟晓亮
李彩虹
曾庆田
-
机构
山东理工大学计算机科学与技术学院
山东科技大学计算机科学与工程学院
清华大学软件学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2024年第8期2832-2843,共12页
-
基金
国家自然科学基金资助项目(62472264)
山东省泰山学者工程专项基金资助项目(ts20190936,tsqn201909109)
+1 种基金
山东省自然科学基金优秀青年基金资助项目(No.ZR2021YQ45)
山东省高等学校青创科技计划创新团队项目(2021KJ031)。
-
文摘
事件日志采样作为近年来流程挖掘领域一个新的研究热点,旨在提高流程挖掘任务的效率,如模型发现、合规性检查、流程预测等。然而目前已有的采样方法不能很好地保证挖掘模型的质量,且针对大规模事件日志的采样效率低。任务紧邻关系作为事件日志中行为描述的基本单元,在各类流程挖掘任务中起到了关键作用。鉴于此,提出了一个通用的面向紧邻关系重发现的事件日志采样方法,该方法可保证紧邻关系的重发现性。为了验证该采样方法的有效性,将其应用于提高已有模型挖掘算法的效率,为了对挖掘模型质量定量评估,提出了基于流程树的模型相似度方法。所提出的采样方法已在开源流程挖掘工具平台ProM6和PM4PY实现,基于12个公开事件日志数据集,将所提出的面向紧邻关系重发现的采样方法与已有方法从模型挖掘质量方面进行了定量比较,实验结果表明所提方法可以在保证模型质量的前提下,大幅提高模型发现效率。
-
关键词
事件日志采样
紧邻关系重发现
质量评估
模型相似度
-
Keywords
event log sampling
directly-follows relation rediscoverbility
quality measure
model similarity
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于变迁紧邻关系重要性的流程相似性算法
被引量:16
- 2
-
-
作者
殷明
闻立杰
王建民
肖汉
丁子哲
高翔
-
机构
清华大学软件学院
中国移动通信集团公司管理信息系统部
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2015年第2期344-358,共15页
-
基金
国家自然科学基金资助项目(61472207
61402301
+1 种基金
61325008)
教育部-中国移动科研基金资助项目(MCM20123011)~~
-
文摘
为了提高模型的检索效率,提出一种基于变迁紧邻关系重要性的相似性算法TAR++,其主要思想是在流程中两两任务之间的紧邻关系上增加一个重要性系数,并将流程的相似度用带重要性的变迁紧邻关系集合的相似度表示。经证明,该算法对应的TAR++距离满足距离度量性质。在SAP、东锅、北车三个公司实际业务流程数据上进行的相关实验表明,该算法具有比较好的时间效率以及良好的灵活性和可操作性。
-
关键词
展开网
行为相似性
变迁紧邻关系
相似性算法评估
-
Keywords
unfolding net
behavioral similarity
transition adjacency relation
similarity algorithm evaluation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名关系数据库中事件日志的紧邻关系高效挖掘方法
被引量:4
- 3
-
-
作者
高俊涛
刘聪
刘云峰
-
机构
东北石油大学计算机与信息技术学院
山东理工大学计算机科学与技术学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2020年第6期1492-1499,共8页
-
基金
国家自然科学基金资助项目(51774090,61902222)
东北石油大学引导性创新基金资助项目(2019YDL-03)
+1 种基金
大庆市指导性科技计划资助项目(zd-2019-22)
山东省泰山学者工程专项基金资助项目(tsqn201909109)。
-
文摘
关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。
-
关键词
流程挖掘
紧邻关系
关系数据库
实验对比
ProM平台
-
Keywords
process mining
directly-follow relation
relational database
experimental comparison
ProM platform
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于行为和结构特征的相似语义工作流检索
被引量:4
- 4
-
-
作者
孙晋永
古天龙
闻立杰
钱俊彦
孟瑜
-
机构
西安电子科技大学计算机学院
广西可信软件重点实验室(桂林电子科技大学)
清华大学软件学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第9期1880-1891,共12页
-
基金
国家自然科学基金项目(61562015
61572146
+6 种基金
U1501252)
广西自然科学基金项目(2015GXNSFDA139038
2016GXNSFDA380006)
广西可信软件重点实验室项目(KX201627)
广西高等学校高水平创新团队及卓越学者计划项目
桂林电子科技大学创新团队项目
广西精密导航技术与应用重点实验室项目(DH201508)~~
-
文摘
相似语义工作流检索是语义工作流重用的首要任务.现有的相似语义工作流检索方法仅关注结构特征,忽略了行为特征,影响了检索到的相似语义工作流的整体质量,提高了语义工作流重用的代价.为此,提出一种结合行为和结构特征的2阶段相似语义工作流检索算法.使用任务紧邻关系集表达语义工作流的执行行为,结合领域知识构造语义工作流库的任务紧邻关系树索引和数据索引.针对查询语义工作流,先基于任务紧邻关系树索引和数据索引进行过滤得到候选语义工作流集;然后使用图匹配相似性算法对候选语义工作流集进行验证,得到排序的候选语义工作流集.实验结果表明,较主流的语义工作流检索算法,该方法的检索性能有较大提升,可以为工作流重用提供更高质量的语义工作流.
-
关键词
工作流重用
语义工作流
相似性检索
结构特征
行为特征
任务紧邻关系树索引
-
Keywords
workflow reuse
semantic workflow
similarity-based retrieval
structural characteristics
behavioral characteristics
task adjacency relations trees index (TARTreelndex)
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
-