论文部分内容阅读
过程挖掘是在日志的基础上去还原业务流程模型的技术。由于市场多样化的需求,系统运行下的模型间通过多种行为交互连接已经成为一种新的趋势,而行为的交互使得事件日志日益冗长,从而增加了过程挖掘的难度。因此,对业务模型进行模块化的分解的挖掘分析具有十分重要的理论意义还有实际意义。 随着大数据时代的到来,各类系统运行产生的日志数据量日益庞大,基于事件日志的过程挖掘算法逐渐开始面临挑战,比如日志信息量的爆炸式增长使得过程挖掘的计算复杂度大幅度升高以及模型的运行效率线性降低等。现有的过程挖掘算法多是基于特征、活动数量较少,且模型要求简单的事件日志,而对于大数据背景下的日志类型,本文提出了基于特征网的交互流程模型挖掘方法,首先,分析了日志中活动对应下的各个特征间的内部特征序关系,由此优先挖掘初始模块网;其次,根据接口变迁以及特征网的定义,遍历日志挖掘接口变迁并对其增添接口库所;然后,运用合成网的观点,通过接口库所将交互模块融合成为一个完善的过程模型。该挖掘方法不仅可以处理包含特征数量较多的日志,还可以有效挖掘交互并不频繁的流程模型。本文的主要贡献还包括: (1)针对业务流程模型挖掘过程中基于单纯事件日志分解模型的情况下,提出基于Petri网接口变迁的模块网挖掘方法。该方法打破了已有分解挖掘算法必须优先挖掘整网的局限性,通过分析局部有效事件日志中各个活动间的前驱后继关系,并基于前驱后继关系相对频繁的活动挖掘接口变迁,之后考虑接口变迁的所有前集变迁输出模块网的初始变迁,再将该初始变迁作为输入,对其逐步添加活动挖掘有效模块网。 (2)针对包含不同活动数目较多的事件日志,提出了基于行为特征网分解挖掘流程模型的方法。在Petri网行为轮廓的基础上结合行为足迹的概念,通过分析不同活动间的行为关系挖掘行为矩阵,并计算行为关系图以此划分活动聚类。同时,过滤子日志挖掘子网,并基于子网有效挖掘行为特征网,最后融合子网行为特征网形成整网。该方法不仅有效地降低了过程挖掘的计算复杂度,而且提高了分解挖掘算法的严谨性,使得挖掘算法更好的适用于更多领域。 (3)针对包含时间/次数信息或者添加指定任务等模型要求的模型,已有的模型优化方法大多基于配置变迁的观点,通过挖掘隐藏变迁以及阻止变迁对该模型进行优化处理,但是简单地挖掘配置变迁并不能有效解决模型要求。对于这一问题,本文给出了基于片段适配优化模型的一个方法。首先,基于配置优化下的配置流程模型分析系统运行下反馈的各个模型要求,并根据模型要求查找需要进行适配处理的流程片段。其次,用适配片段替换配置流程模型中与适配片段重叠的隐藏变迁以及阻止变迁,并保留其他配置变迁。最后,基于模型要求选择匹配的适配模式类型。同时,通过插入适配规则对适配片段增加时间任务或者限制其发生次数,以此对配置流程模型进行优化处理。