自然语言问题转成SQL查询的问答系统研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:aerostock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临以及计算机硬件性能的高速提升,深度学习技术在各大领域都取得了显著的成果。在自然语言处理领域,深度学习技术已经得到了普遍的应用,传统的问答系统也朝着智能问答系统的方向迈进。随着大规模结构化数据的积累,基于结构化数据的智能问答系统成为了主流。本文以英文的NL2SQL任务为研究对象,通过深度学习技术完成单表场景下和多表场景下的NL2SQL任务。首先,针对于单表查询场景下生成的SQL查询语句存在不符合SQL语法规则和WHERE值预测不准确的问题,提出了融合SQL语法和增强列信息的算法模型SQLModel。模型使用BERT的自我注意力机制完成列信息的增强,依据SQL语法规则建立了子模型的关系依赖图,使得子模型按照关系依赖图顺序执行。其次,针对于多表查询场景下存在自然语言问题和表列难以信息融合以及自然语言问题转换SQL查询语句能力不足的问题,提出了基于注意力机制的信息融合和信息过滤的算法模型Attn-ED。模型是基于注意力机制的Encoder-Decoder模型,Encoder端解决问题和表列难以信息融合的问题,Decoder端解决转换SQL查询语句能力不足的问题。最后,针对于SQLModel模型和Attn-ED模型,本文使用相关数据集对二者进行训练和评价,实验结果显示,本文的模型在多种评价指标上有了明显的提升,证明了模型的有效性。
其他文献
机动目标跟踪技术就是基于雷达、声呐等各类传感器对目标的观测,得到关于机动目标的一些原始数据信息,通过建立合理的运动模型,以及融合各种滤波方法对目标的运动状态进行估计和预测的技术。该项技术是现代雷达导航系统中的重要组成部分,在军事和民事领域中发挥着极其重要的作用。随着现代科学技术的快速发展,人们对导航系统的精度和可靠性要求越来越高,这给机动目标跟踪技术的理论研究和实际应用提出了更高的要求。基于此,本
低温共烧陶瓷(Low Temperature Co-Fired Ceramics, LTCC)封装能将不同种类的芯片等元器件组装集成于同一封装体内以实现系统的某些功能,是实现系统小型化、集成化、多功能化和高可靠性的重要手段。总结了LTCC基板所采用的封装方式,阐述了LTCC基板的金属外壳封装、针栅阵列(Pin Grid Array, PGA)封装、焊球阵列(Ball Grid Array, BGA
由于水下空间环境物理特性复杂,噪声多源且动态变化,传统的集中式或者采用声呐阵列的目标跟踪方式无法实现高精度的水下定位与跟踪。水下分布式网络因其监测范围大、部署灵活等特点,为水下目标状态估计提供了更加实时有效的数据支持,使得高精度的水下运动轨迹跟踪成为可能。为降低水下环境噪声对观测信息准确性的影响,提供高精度的水下定位与跟踪服务,本文对现有的水下跟踪方法进行综合探讨,并采取仿真模拟的方法对不同方法进
目前,人们一般认为,葡萄糖在胚胎发育的早期起抑制作用,后期则起促进作用。但早期产生抑制作用的机理却没有定论。本实验以昆明小鼠的早期胚胎为研究对象,以mCZB培养液为基础培养液,通过添加葡萄糖和抗氧化剂谷胱甘肽(GSH),对葡萄糖在胚胎体外培养中抑制胚胎早期发育的机理进行初步探讨。在培养不同时间添加葡萄糖对小鼠胚胎发育的影响的实验中,mCZB组、第1~4天组、第2~4天组、第3~4天组和第4天组的囊
随着世界科学的日益发展,人工智能技术在图像检测与分割方面的研究受到越来越多研究学者的关注,其中语义分割是图像检测与分割的一个重要分支,其已在日常生活中得到了广泛的应用。其中DeepLab网络是一种非常有效的深度卷积语义分割网络模型,它对目标图片能较好地进行识别分割,但该网络仍存在一些不足。本文针对如何进一步提高DeepLab网络模型性能展开研究,本文主要工作与创新点描述如下:(1)为了增加网络模型
本文研究了一个mπ≠0时的改进的Skyrme模型,在重子数守恒的新的标度变换下,同时考虑孤立子的转动与振动耦合,通过最低阶半经典近似处理,推出了包括振动与转动耦合在内的、与标度参数有关的孤立子哈密顿,由N、Δ的能级分裂公式定出了理论参数fπ和m,并且计算了核子的静态性、N、Δ的能量。计算结果表明,和原先Skyme模型的预言相比,绝大部分数据有了改进。其结果基本符合于实验值。
近年来,随着电商平台的日益发展,产生的数据量也逐渐庞大,如何有效地从各类多源异构数据中挖掘出有效信息成为亟待解决难题。电商平台多采用基于关键词匹配的商品检索机制,匹配范围往往局限于商品标题,商家为了提高自身销售商品的检索率往往会在商品标题中加入对商品特性的描述或优惠信息等文本给商品真实名称的识别带来很大困难。因此,本文将从以下几个方面进行研究。首先,针对电商领域命名实体识别比较困难的问题,使用Se
随着人工智能技术的发展及广泛应用,图像显著性检测技术成为计算机视觉领域热点研究内容之一。图像显著性检测原理是模仿人类视觉注意力机制提取图像中包含着重要信息的显著区域,进而降低后续图像处理任务的计算复杂度,提高计算效率。该技术广泛应用于图像检索、图像分割等计算机视觉处理任务。图像显著性检测算法的研究具有重要意义。首先对传统算法提取特征较为单一,生成的显著图背景抑制不彻底,前景丢失等不足进行改进。设计
水下图像是海洋信息的重要载体,是人们获取水下信息的重要来源,在海洋资源的勘探开发中得到了广泛的应用。但光在水中传播时,水介质会对其产生强烈的吸收和散射作用。这会给水下图像带来细节模糊、对比度低、颜色退化等严重问题,图像的失真限制了目标的能见度,给物体识别带来一定的困难。因此,利用图像处理技术还原水下图像的真实面貌具有很高的实用价值。本文根据颜色线(color-line,CL)理论对退化水下自然彩色
【目的】调查常态化疫情防控下上海市区级疾病预防控制中心的公共卫生应急核心能力建设情况,分析不足之处,为提高上海市疾病预防控制系统面对突发公共卫生事件的应急核心能力提供建议和科学依据。【方法】采用问卷调查的方法,对上海市16家区级疾病预防控制中心的应急体系建设、疫情监测和风险评估、应急队伍人力和物资装备、新型冠状病毒肺炎(COVID-19)疫情实际应对等方面进行调查和评估。【结果】上海市区级疾病预防