【摘 要】
:
随着旅游经济的繁荣增长,游客出行人数也在逐年递增,与旅游相关问题也开始逐年涌现。然而旅游问答社区存在延时性,游客难以及时获得最佳的问题解答。如何从繁杂的旅游信息中快速有效的获取有价值信息已成为了研究热点,自动问答因此受到越来越多的关注。自动问答旨在通过理解用户问句语义,快速定位答案候选范围,并直接返回答案。其中问题分类作为自动问答基础却又至关重要的部分,它具有答案指向性。通过预判问句期望的类别标签
论文部分内容阅读
随着旅游经济的繁荣增长,游客出行人数也在逐年递增,与旅游相关问题也开始逐年涌现。然而旅游问答社区存在延时性,游客难以及时获得最佳的问题解答。如何从繁杂的旅游信息中快速有效的获取有价值信息已成为了研究热点,自动问答因此受到越来越多的关注。自动问答旨在通过理解用户问句语义,快速定位答案候选范围,并直接返回答案。其中问题分类作为自动问答基础却又至关重要的部分,它具有答案指向性。通过预判问句期望的类别标签,从而对后期答案选择提供约束,进而提升抽取答案准确度。问题分类的质量在一定程度上决定了问答系统整体质量。本文旨在利用深度学习技术,研究联合模型在问句分类上的应用。针对中文旅游领域问句,提取问句特征,利用深度学习联合模型加以合并和应用,最终构建能有效分类问句的深度学习模型。主要研究内容为以下几方面:(1)构建中文旅游领域问句语料库。目前中文问题分类相关的语料库匮乏并且问题分类的标准不统一,中文领域问句分类研究尚未成熟。目前旅游服务行业问题较多,本文收集了各大旅游网站社区的游客问句语料;然后结合国内广为接受的哈工大分类体系标准,对问句语料进行了标注,构建了一定规模的中文旅游问句语料库。(2)基于深度学习联合模型的问题分类研究。在已构建的中文旅游领域问句数据集的基础上,本文进一步提出了联合多种深度学习模型的问句分类方法,将不同的模型学到的不同层次语义信息拼接互补,以提高问题分类的精度。具体将问句从句法和语义子空间两个角度进行分析,首先是构建最佳层数的词级卷积神经网络,从旅游文本序列中获取低层级的子空间结构信息,以提高问句词级空间结构信息的表征能力;然后构建句子级双向长短期记忆网络,从问句句子中进一步获取文本的全局深层语义和句法信息,与词级卷积神经网络所获取的低层级空间结构信息形成互补。最终为了进一步突出关键信息,利用多头自注意力机制,对上述双分支分类器所提取的问句特征通过分配注意力权重,使二者进行联合。最终使得联合模型在问句分类取得了98.66%的准确率,也通过一系列对比试验体现了本联合模型设计的有效性。经过一系列的对比实验发现,该模型能有效地提升问句分类能力。
其他文献
使用果园土壤采样机器人有助于提高作业效率,路径规划作为果园土壤采样机器人的关键技术,其算法的选取将直接影响机器人的工作质量和效率。本文结合果园环境特点,为了使算法规划出最优的安全无碰撞路径,针对基于粒子群算法和蚁群算法进行路径规划的研究。本文针对提高果园机器人在全局静态环境中搜索最优路径的能力,提出一种将粒子群与蚁群这两种算法的优势进行互补的融合算法。改进算法为解决粒子群算法易出现局部极值的问题,
为满足软弱地基上新建路堤的沉降与稳定性要求,必须事先对软土予以处理。桩承式加筋路堤因具有使路堤工后沉降小且均匀、稳定性高且施工速度快等优点,在工程中得到了广泛应用。通常,为便于施工和降低造价,桩承式加筋路堤的桩帽之间是没有设置连梁的。但工程实践发现,如果路堤填土较高、地基软土层较厚、软基中桩帽间无连梁约束,则可能导致边桩水平侧移和弯矩过大、路堤边坡失稳甚至边桩折断。此外,桩承式路堤在自重和车辆荷载
根据目前全球制造业发展的趋势来看,发达国家的制造业企业均已开展服务化转型经营战略,且根据目前各大型跨国制造业企业的经营实际来看,服务化转型已经为各企业提供了新的利润增长点,并带动了企业整体绩效的积极增长。而与发达国家相比,我国制造业的整体服务化转型程度较低,服务业务为企业带来的利润未达预期,且较多企业在实际经营中并无服务化转型的经营理念。长江经济带是目前世界上可开发规模最大,影响范围最广的内河经济
在当今大数据时代的背景下,函数型数据作为一种数据存储量较大的结构化数据,较之传统的结构化数据更加具有灵活性,因此更加受到了统计学家们的重视。当数据在时间维度上存在
社交平台的快速兴起带来了大量的社交网络数据,这些数据蕴含丰富的信息,如何挖掘其中的有效信息备受学者关注,社交网络节点分类便是其中一个研究热点。然而,现有的社交网络节点分类方法仍面临如下挑战:(1)如何灵活地融合社交网络的节点属性信息和连接结构信息,并挖掘节点之间的交互关系。现有的算法多为基于传统分类器或基于随机游走的标签传播方法,不能灵活地融合社交网络中实体的属性信息和实体间的交互信息,也鲜有考虑
随着我国城市中高层建筑、超高层建筑的大量兴建,基坑的开挖深度不断增加,涉及地下空间结构的深基坑工程日益增多,这种趋势无疑推动了我国深基坑支护方法、理论和施工技术的
光电经纬仪是现代靶场中常用的大型光学检测设备,主要用于自动捕获跟踪进入视场范围内的远距离飞行目标,以获得其飞行位姿、几何形态以及飞行轨迹等内容的数据。这些数据对科学研究和军事国防领域都有着重大的意义。由于被测目标造价昂贵、不可回收再利用且运动速度极快,若成像系统无法及时的处理响应离焦信息,就会造成成像模糊的后果,损失大量的细节信息。无法采集相对准确的测试数据,大大提高试验成本。目前,光电经纬仪多采
芬斯勒卷积度量是黎曼卷积度量的自然推广,它是包含球对称芬斯勒度量在内的一类新的芬斯勒度量。黎曼几何量是黎曼几何中相应的几何量在芬斯勒几何中的自然延伸,如旗曲率、Ricci曲率等。芬斯勒几何中除了一些黎曼几何量,还有一些非常重要的非黎曼几何量。非黎曼几何量是芬斯勒几何中特有的,在黎曼几何中消失的几何量,如S曲率、Douglas曲率等。目前,关于芬斯勒卷积度量这一方面的的研究内容还比较少,这一领域还有
英语作为全球最广泛使用的语言,承担着它重大的交际功能。自从中国打开国门拥抱世界开始,我国始终高度重视英语学科的教育,这点可从基础教育到高等教育英语学科的安排上显而易见。最新版2017版《高中英语课程标准》中提出培养学生听、说、读、写、看五方面的技能,提高这些技能是高中英语教学的核心内容和语言学习的重要支撑点。从许多教学实践中得知,如何提高高中生的英语写作能力一直困扰着教师和学生们,高中生们普遍总是
在现代银行的管理中,流动性风险管理一直是困扰银行管理层和监管部门的难题。当银行系统内的多数银行共同面临资金流动性危机和融资困难的情况时,就有爆发系统流动性风险的隐患。银行系统流动性风险会严重危及国家经济的稳定。2008年美国金融危机爆发后,世界各国对于完善监管体制都表现出迫切的需求,所以巴塞尔委员颁布了Basel III,各国监管当局也推出新管理办法,力求改变银行资本和流动性管理现状。虽然Base