基于微信的客服系统中问题分类技术及近似语义模型研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:ysr123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统是自然语言处理领域一个重要的研究方向。系统主要任务是将用户提问与知识库里的问题进行匹配,然后给用户提供精准的反馈。目前售后服务逐渐成为许多企业核心部门之一,企业客服规模随着服务用户的增长而扩大。高效实用的自动问答系统普及有助于解放大量人力资源。论文以微信问答系统为应用背景,其中相关研究技术核心为任务分类模块和系统自动问答模块,全文主要介绍了以下几方面工作:首先介绍了微信客服系统整体架构,简述了系统的运行流程,并且详细描述了问答流程中任务解析模块、任务特征提取模块、任务分类模块、信息去重模块、近似语义计算模块、模型增量训练模块和消息反馈模块的作用。论文还根据自动问答相关技术模型实现对应功能。然后,论文重点对自动问答任务分类模块和近似语义计算模块进行深入阐述和分析。在任务分类模块中,根据系统实际运用总结传统分类的不足,再从特征表示角度提出了相应的改进方案。在近似语义计算模块中,本文分析了基于Ngram overlap近似度计算、基于编辑距离近似度计算和基于同义词扩展近似度计算。根据以上方法的缺陷提出了基于卷积神经网络的近似度计算模型。接着通过实验对模型的正确性和有效性进行了验证,而且根据实验结果分析了不同实验中对比模型的效果。最后从系统功能静态视图描述、系统时间关系描述、系统的结构化设计和数据存储模块设计几个方面对系统进行了详尽的描述。本文介绍了微信客服系统自动问答模块的实现方案,对近似语义检索做了详尽的研究。模型可行性方面得到了验证,但是这种解决方式还有许多问题有待解决,如:卷积神经网络模型的每一层神经元个数多少会影响着模型的性能和抽象能力,但数量多少目前并没有统一定论,所以需要进一步调整和改进模型。本文以卷积神经网络抽象特征和聚类特征产生映射达到训练近似句的目的,但聚类特征在模型里的使用是否有更好的替代方式还有待挖掘。
其他文献
聚合物量子点(Polymer dots,Pdots)是近几年发展起来一种基于聚合物的新型有机荧光纳米粒子,具有优异的光学性质,结构多样,易于表面修饰以及良好的生物相容性等优点,在生物成像
研究星系核区对于了解星系中心黑洞的吸积及反馈机制、和宿主星系的共同演化非常重要。由于M31距离地球很近且核区消光比较低,所以M31很适合研究星系核区的物理性质。行星状
非水系Li-O2电池因超高的理论比能量(11000 Wh kg-1)而被作为下一代能源储备系统应用于电动汽车领域。近年来,Li-O2电池的研究虽然取得了很大的进步,但是依旧存在很多问题限
大邑构造位于四川盆地西部,构造位置上属于龙门山南段山前隐伏构造带。研究区构造现象丰富,地层变形复杂,油气资源丰富,是龙门山前缘褶皱带内油气勘探的重点局部构造。前人研究多注重于对大邑构造储层裂缝识别、裂缝类型、裂缝发育特征以及天然气成藏条件等方面的研究,对其构造演化分析的较少,且多为二维地震资料。本文以三维地震数据为基础,对大邑地区的构造几何样式进行分析,结合断层相关褶皱理论,运用平衡地质剖面技术对
时域天文学是一个研究具有时变特性的天文现象的领域,要求使用望远镜对同一个目标天体在一定时间尺度内进行足够多次数的观测,因此,望远镜观测数据中天文图像数据的时序子集
苯是一种化学致癌物,长期慢性苯暴露可以导致再生障碍性贫血、骨髓增生异常综合征、急性髓细胞性白血病及恶性淋巴瘤。骨髓是重要的造血器官,缺氧诱导因子HIF-1α在骨髓缺氧
体系的电子激发态及其激发谱性质在物理和化学中有重要的应用。从而深入地了解、精确计算体系的电子激发态显得尤为重要。在局域密度近似(LDA)的密度泛函理论(DFT)的基础上,并运用多体摄动理论(MBPT)的GW近似,本文计算了MgS和LiCl块体的准粒子能带。引入电子-空穴相互作用并求解Bethe-Salpeter方程(简称BS方程),本文进一步计算了MgS和LiCl块体的光吸收谱。利用多体摄动理论的
延安时期知识分子改造是中国社会革命的一项重要政治任务。在中国共产党知识分子政策的指引下,知识分子努力从价值重塑、话语转变和身份建构三个层面进行自我改造:通过整风学
随着世界范围内人口数量的增加以及居民生活水平的提升,人们对市政用水的需求量也呈逐年增加趋势。与此同时,大部分地区则面临严重的水资源短缺和水质污染问题,单纯依赖传统
与传统吸收器相比,超材料吸收器具有吸收率高、结构厚度薄、吸收频带宽、以及吸收频带可调等诸多优点,因其广阔的应用前景而受到研究者们的青睐。本文工作主要围绕吸收-透射