论文部分内容阅读
近年来,深度学习在自然语言处理和图像处理领域取得了很好的成绩,使得智能对话系统不再满足于仅仅采用基于规则或基于检索的方式。基于语料的对话生成模型相比基于规则和基于检索的对话系统更具泛化性和迁移性,显得更加智能。本文着眼于如何生成能响应用户输入的连贯、愉快和引人入胜的对话。在基于RNN的生成模型的基础上,加入一个可以判别真实数据和生成数据的判别器,使用对抗的思想来让生成器效果更好。其中生成器努力改进自己从而生成足以迷惑判别器的数据,同时判别器也不断改进自身并且努力分辨真实数据和生成数据。如此相互对抗使得生成器达到一个很优的效果。由于原生的生成对抗网络无法对离散数据进行微调,本文还结合了强化学习的方法来进行对话生成的对抗训练。将已产生的序列视为当前状态,要生成的下一个符号视为动作,将一个动作被执行后发生的状态转移视为策略。然后还用蒙特卡洛树搜索将每一个动作的各种可能性进行补全,从而使判别器能对完整的序列进行评分产生Reward然后回传给生成器,即通过策略梯度法更新生成器。这是扩展GAN以生成离散符号序列的一项有意义的工作,通过结合人工评价和判别器评价的方式,本文对比了对抗训练下的生成模型与常规Seq2Seq生成模型的表现,验证了所提出模型的有效性。本文还面向王者荣耀数据集,首先构建了针对该款游戏的实体知识库、关系库,收集了该款游戏讨论板块的丰富语料。以此为基础设计并实现了一个组合不同回应策略的智能对话系统——王者问答。该系统使用基于规则式、基于检索式以及对抗训练的生成模型的多种策略,组合成一个面向封闭数据集的非任务型智能对话系统,可以针对王者荣耀这款游戏中几乎所有的话题进行类人类的讨论。