首先对过程模型的三种表示方法Petri网、因果网和过程树进行了介绍。指出了目前过程挖掘算法研究中需要注意的三类关键问题。对主流的过程挖掘算法进行了分类总结。深入比较了当前最有效的三种过程挖掘算法Evolutionary Tree Miner、Ind...首先对过程模型的三种表示方法Petri网、因果网和过程树进行了介绍。指出了目前过程挖掘算法研究中需要注意的三类关键问题。对主流的过程挖掘算法进行了分类总结。深入比较了当前最有效的三种过程挖掘算法Evolutionary Tree Miner、Inductive Miner和Hybrid ILP Miner,并指出了三种算法的优势和不足。最后,对过程挖掘算法的研究趋势进行了总结。展开更多
针对词对齐算法在处理大规模平行语料时计算时间复杂度较高的问题,提出一种基于图形处理器(GPU)的词对齐并行计算方法。首先分析了大规模语料中句对长度的分布特征,结合现代GPU的体系架构,提出基于预排序的任务分配策略;然后基于统一计...针对词对齐算法在处理大规模平行语料时计算时间复杂度较高的问题,提出一种基于图形处理器(GPU)的词对齐并行计算方法。首先分析了大规模语料中句对长度的分布特征,结合现代GPU的体系架构,提出基于预排序的任务分配策略;然后基于统一计算设备架构(CUDA)完成对词对齐算法中的期望计算、期望最大化两个核心步骤的并行实现。在NVIDIA Tesla K40M图形处理器上进行了实验,结果表明,该方法与GIZA++相比最高达到246的加速比。展开更多
文摘针对词对齐算法在处理大规模平行语料时计算时间复杂度较高的问题,提出一种基于图形处理器(GPU)的词对齐并行计算方法。首先分析了大规模语料中句对长度的分布特征,结合现代GPU的体系架构,提出基于预排序的任务分配策略;然后基于统一计算设备架构(CUDA)完成对词对齐算法中的期望计算、期望最大化两个核心步骤的并行实现。在NVIDIA Tesla K40M图形处理器上进行了实验,结果表明,该方法与GIZA++相比最高达到246的加速比。