分享自:

从事件日志中自动发现业务流程仿真模型

期刊:Decision Support SystemsDOI:10.1016/j.dss.2020.113284

本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:

该研究由Manuel Camargo、Marlon Dumas和Oscar González-Rojas共同完成,分别来自爱沙尼亚的塔尔图大学(University of Tartu)和哥伦比亚的洛斯安第斯大学(Universidad de los Andes)。研究发表于2020年的《Decision Support Systems》期刊,题为《Automated Discovery of Business Process Simulation Models from Event Logs》。

学术背景

该研究属于业务流程管理(Business Process Management, BPM)领域,具体涉及业务流程模拟(Business Process Simulation, BPS)和流程挖掘(Process Mining)技术。业务流程模拟是一种用于在多场景下评估流程性能的技术,帮助分析师比较不同改进方案。然而,构建精确的模拟模型通常耗时且容易出错。现代信息系统存储了详细的业务流程执行日志,这些日志可用于发现模拟模型。然而,现有的基于日志的模拟模型发现方法并未优化模型的准确性,而是依赖用户手动调整模型以达到所需精度。因此,本研究提出了一种从执行日志中发现业务流程模拟模型的优化方法,旨在通过自动化手段提高模拟模型的准确性。

研究流程

研究的主要流程包括以下几个步骤:

  1. 预处理阶段
    该阶段从事件日志中提取业务流程模型,并确保其与日志的一致性。

    • 控制流发现:使用Split Miner算法从事件日志中生成BPMN(Business Process Model and Notation)模型。Split Miner算法能够在高精度(精确度和拟合度)和模型简洁性之间取得平衡。
    • 对齐评估:通过比对日志中的轨迹与模型生成的轨迹,评估两者的一致性。使用基于同步移动(synchronous move, SM)、模型移动(move-on-model, MM)和日志移动(move-on-log, ML)的拟合度度量方法。
    • 日志修复:针对与模型不完全匹配的轨迹,采用移除、替换和对齐三种方法进行修复,以提高日志与模型的拟合度。
  2. 处理阶段
    该阶段从日志中提取模拟参数,并将其与流程结构结合,生成业务流程模拟模型。

    • 日志重放:通过重放算法计算每个活动的处理时间和启用时间,以及条件分支的遍历频率。
    • 到达时间分布发现:确定案例到达时间的概率分布函数(PDF),如正态分布、指数分布等。
    • 条件分支概率:通过重放或对齐日志,确定条件分支的概率。
    • 活动处理时间:通过拟合数据序列,确定每个活动处理时间的概率分布。
    • 资源池发现:使用算法发现资源池,并确定每个活动的资源池分配。
    • 模拟模型组装:将所有模拟参数与BPMN模型结合,生成完整的业务流程模拟模型。
    • 流程模拟:将模拟模型输入模拟器,生成模拟事件日志。
  3. 评估与优化阶段
    该阶段旨在评估模拟模型的准确性,并通过超参数优化方法提高模型精度。

    • 模拟模型准确性评估:通过比较模拟日志与原始日志的相似性,使用基于时间字符串编辑距离(Business Process Trace Distance, BPTD)的度量方法评估模型准确性。
    • 超参数优化:使用树结构Parzen估计器(Tree-structured Parzen Estimator, TPE)作为超参数优化器,搜索最佳参数配置以最大化模型准确性。

主要结果

研究通过实验评估了所提出方法的有效性,使用了三个不同领域的事件日志(采购到支付流程、学术认证流程和制造生产流程)。结果表明,超参数优化方法显著提高了模拟模型的准确性。具体而言,优化后的模型在三个事件日志中的准确性均显著高于基线模型。通过Mann-Whitney U检验,优化模型与基线模型之间的准确性差异在统计学上显著。

结论与价值

该研究提出了一种自动发现业务流程模拟模型的方法,并通过超参数优化提高了模型的准确性。研究的主要科学价值在于提供了一种从事件日志中自动生成高精度模拟模型的技术,解决了传统方法中依赖手动调整的痛点。该方法的应用价值体现在其能够帮助企业和组织更高效地模拟和优化业务流程,降低改进成本。此外,研究还提出了一种基于时间字符串编辑距离的模型准确性度量方法,为业务流程模拟模型的评估提供了新的工具。

研究亮点

  1. 方法创新:提出了一种自动发现业务流程模拟模型的方法,并结合超参数优化技术提高了模型精度。
  2. 工具开发:实现了名为Simod的开源工具,支持从事件日志中生成模拟模型,并能够与BIMP和Scylla等模拟器集成。
  3. 评估方法:提出了一种基于时间字符串编辑距离的模型准确性度量方法,能够更全面地评估模拟模型的性能。
  4. 实验结果:通过实验验证了所提出方法的有效性,证明了超参数优化在提高模型准确性方面的显著作用。

其他有价值的内容

研究还讨论了现有方法的局限性,例如未考虑多任务处理、批处理和优先级延迟等现象,并提出了未来研究方向,包括扩展模拟技术以解决这些问题。此外,研究呼吁更多真实事件日志的公开,以支持更系统的评估和优化研究工作。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com