论文部分内容阅读
随着网络信息技术的迅速发展,众包作为一种全新的服务方式出现在互联网平台,正在吸引着越来越多的工作者参与。最近几年,众包已经被广泛的应用于商业、科研中的许多领域,取得了不错的工作效果。然而众包依托于复杂的在线网络交易平台,任务的发布是面向互联网上的所有用户,接受工作者的身份匿名,每一个工作者能力大小、工作态度各不相同,导致众包任务的结果具有较大不确定性,不能满足任务需求者的要求。因此,如何有效地提高众包结果的质量是当前国内外众包研究中亟需解决的热点问题。本文首先在大量阅读国内外众包文献的基础上,经过归纳总结,阐述了众包模式的概念以及众包在国内外的研究现状,并对众包模式在商业和科学研究中的应用进行了总结。之后介绍了目前关于众包质量控制研究的相关工作,分析了现有众包质量评估方法中的不足,给出了相应的改进方法,对有效提高众包结果质量评估具有重要意义。本文所做的主要工作如下:(1)提出了一种众包质量评估架构,包括众包任务发布、工作者分类和迭代检测策略3个模块。在该架构中,首先使用工作者分类算法对参与众包任务的工作者人群进行分类,选择优秀的工作者加入到候选人群;然后从候选人群中选择工作者参与众包任务,根据工作者提交的任务结果,采用少数服从多数的原则进行评估,将评估任务中选项不唯一的结果集作为新的任务再次发布到众包平台,选择候选的工作者人群参与迭代检测操作,直到确定出每一个任务的最优结果。通过众包的迭代检测策略可以有效的识别出评估任务中存在的相近结果,提高众包质量评估的准确性。实验表明,与基于熵的经典质量评估算法相比较,该策略能够取得较好的效果。(2)针对目前大多数众包质量评估的算法只是从提高众包结果质量的准确度方面考虑,很少考虑众包工作者支付的成本问题,提出一种基于迭代的近似人群一致算法。该算法首先建立工作者质量评估模型,根据工作者完成任务后的评估结果,选取高质量的人群代表组成一个最小的子集;然后对生成的子集结果进行加权求和,如果得到的结果不能反应多数群众的意见,则将候选人群中的工作者加入最小子集再次进行加权求和,直到任务结果逼近大多数人群的意见。算法经过多个实例的迭代操作后,可以从工作者人群中准确的选择出典型的人群代表,降低众包支付的成本。通过在不同的数据集与基准算法进行比较,结果表明:该算法能够取得较好的效果。