论文部分内容阅读
工作流是一种反映业务流程的计算机化的模型,是为了在先进计算机环境支持下实现经营过程集成与经营过程自动化而建立的、可由工作流管理系统执行的业务模型。工作流的生命周期包括工作流设计、工作流配置、工作流执行、工作流诊断四个阶段。传统工作流管理方法存在的一个问题是:设计阶段工作通常由业务专家具体执行,并力求体现企业管理层改进当前业务流程的思想。实践证明,建立一个工作流过程模型是一项复杂和耗费时间的工作;不仅如此,建立的过程模型往往不能与实际过程完全相符。
工作流挖掘技术不是一个工作流设计的工具,但它对充分理解现有业务过程执行情况有很大的帮助。工作流挖掘的目标是:倒转过程,收集和利用运行数据,从而支持工作流设计和分析。通过多年的信息化建设工作,很多组织都拥有或大或小的传统信息化管理工具,如管理信息系统(MIS)、企业资源计划(ERP)、客户关系管理(CRM)等。大多数信息系统都能够记录事务数据,这些运行数据记录了长时间的业务过程具体执行情况,可以用来生成一个描述业务过程的模型。
工作流挖掘的起点是收集和处理工作流日志。本文对工作流日志定义是任务序列(二元组)的集合。本文提出的定义在保留必要日志信息的基础上,简化了工作流日志的形式。本文还对日志相关概念做出了定义。
目前,工作流挖掘技术的一个难点是:怎样挖掘出更多有价值的过程信息。对于一组工作流日志,以往挖掘算法的处理方法均是对其整体进行挖掘处理。而在实际生产生活中,很多业务过程往往会随时间变化、环境变化、业务变动而发生变化。
针对以往工作流挖掘技术对日志动态特性缺乏分析的缺点,本文提在工作流网模型的基础上提出动态工作流网(DWF-net)。DWF-net由动态变迁、动态库所和它们之间的有向弧组成。动态变迁具有一个属性二元组(s,d),s表征动态变迁在工作流日志中出现的频率,也称为动态变迁的支持因素,当支持因素满足指定条件时,动态变迁被认为是“真实的”;d描述动态库所支持因素s的变化情况,称为支持因素s的“动态描述”。动态库所也具有一个属性二元组(c,d),c表示置信因素,d表示置信因素c的“动态描述”。本文同时给出了DWF-net及其组件的定义,进行了合理性分析,并给出了生成动态工作流网的算法。DWF-net能够充分挖掘工作流日志中的信息,获取日志中业务变化的情况,并在挖掘得到的工作流模型中描述变化的情况。
生成动态工作流网,首先要求得DWF-net的结构,然后计算DWF-net中各元素的动态描述。本文首先介绍了这两步工作的思路,然后给出了算法描述,并对算法时间复杂度进行了分析。
原型系统DWFgenerator实现了本文描述的动态工作流网生成算法。该系统是基于Matlab6.5开发的。该系统能够对符合本文工作流日志定义的工作流日志进行挖掘,输出动态工作流网。