基于深度强化学习的对话管理模型研究与应用

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:isongnosi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
任务型人机对话系统旨在提供基于自然语言的人机交互方式,在智能客服、智能个人助理等方面具有广泛的应用。传统的对话系统分为自然语言处理、对话管理和自然语言生成三个部分,对话管理是任务型人机对话系统的核心组成部分,用来控制整个对话的逻辑和进行对话动作决策。三个部分独立建模,顺序执行,存在着误差累积等问题。因此,出现了一些联合建模的研究以缓解这一问题。本文研究自然语言理解和对话管理的联合建模,主要内容如下:本文提出了一个基于深度强化学习的自然语言理解和对话管理联合模型。该模型由三个级联的深层神经网络组成,底部两个循环神经网络自下往上分别建模当前对话句子以及到当前时刻为止的对话表示,上层的深度神经网络进行对话动作决策。该模型直接将自然语言文本映射到对话动作,融合了自然语言处理与对话管理。模型采用了深度强化学习技术进行集成训练。本文将上述模型应用到客服任务中,实现了一个基于联合模型的会议室预订人机对话系统,实验结果表明,系统性能优于已有的基于传统对话管理模型和联合模型的对话系统,其习得的对话层表示可以准确地映射到可解释的对话状态。
其他文献
哈尔滨市中华巴洛克历史文化街区,是中国国内少有的中西风格合并的建筑群。该街区虽已发展出自己的生态文化,但是由于人口越来越多,出现了居住拥挤、公共基础设施不足等问题
文中针对电动汽车充电桩设备监控系统在安全机制方面存在的问题,对监控系统的信息安全进行设计研究。系统的信息安全性主要从三方面设计:基于SHA1不可逆加密算法的系统登录认
本文针对枣泉煤矿综采放顶煤回采工艺实际情况,提出以责任落实为重点,实施量化指标考核为核心,强化措施落实为关键的管理机制。
自2017年来,以手机为主的移动智能终端技术极速发展,“微影像”传播时代到来,短视频成为城市形象构建与传播的新途径。用短视频讲好城市故事,将城市精神和城市文化更好地传递
互联网金融日益繁荣,越来越多的投资人选择P2P平台投资理财,但是在获得高收益的同时,又面临着较传统投资方式较高的投资风险。随着P2P行业的快速发展,平台跑路、倒闭现象不断
目的探讨集束化干预策略在重症监护病房(ICU)患者失禁相关性皮炎(IAD)预防中的应用效果。方法选取2018年1月—12月入住综合ICU的363例患者为研究组,2017年1月—12月入住综合I
为了探讨影响塞罕坝地区华北落叶松(Larix principis-rupprechtii)人工林天然更新的关键因子,基于两个龄级(Ⅲ龄级,20—30a、Ⅳ龄级,30—40a)共计18块(50m×50m)华北落叶松人