论文部分内容阅读
众包(Crowdsourcing)指的是一个公司或机构把过去由内部员工执行的工作任务以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。随着要处理的众包任务越来越复杂,目前常用众包工作模式是将众包与工作流结合,通过“任务拆解→工人处理简单任务→结果合并”的众包过程来得到原始众包工作的解决方案。众包工作流中各任务各属性参数的设置,都会影响众包工作的整体完成效果。因此,在发布众包工作流中任务时,要对它们各任务属性的值进行合理的设置,以提高工作流的完成效率,降低完成成本。这就是众包任务发布(Crowdsourcing Task Publishing,CTP)问题。目前,对于CTP问题方面的研究还比较少。现有的研究中将CTP问题规约为一个约束求解问题来为任务各个任务属性找到其应设置的全局最优值。但当要处理的任务数量较多时,约束数量也会随之增加,求解时间将迅速增长。而在众包环境中,需求者将任务发布到众包平台上后,往往希望任务能够尽快被处理,过长的求解时间是不可接受的。如果优化过程耗费太长时间的话,会影响整体的工作进度,降低工作效率。因此,需要对CTP问题的解决方法进行进一步的讨论。本论文的主要贡献点如下:(1)提出了众包工作流中的CTP问题的解决框架,明确了框架中数据分析模块、优化模块和任务发布模块的主要功能;在考虑影响众包任务完成质量的多种因素的情况下,确定了 CTP问题的目标和应当考虑到的诸多限制条件。(2)CTP问题解决框架中的优化模块,需要对任务属性参数设置问题进行优化。优化问题可被规约为一个二次规划问题对其进行优化(在文中被定义为CTP-C优化方法);为缓解约束求解优化方法中求解时间随问题规模增大而迅速增长的问题,提出了基于包含四种启发式策略的启发式方法的优化方法来对CTP问题进行优化(在文中被定义为CTP-H优化方法)。(3)通过一系列的实验,比较了不同约束求解工具对CTP-C优化方法的影响效果;对任务发布模块中任务发布条件的合理设置进行了验证实验;对CTP-C优化方法和CTP-H优化方法各自的可行性和适用性进行了实验对比和分析。