一种基于BERT的中文NL2SQL模型

来源 :山东大学 | 被引量 : 0次 | 上传用户:erkonga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Bert模型为Google开发的基于Transformer Encoder的大规模语料预训练语言模型,在自然语言处理领域(Natural language Processing)近乎各个子领域内均获得了大幅度的突破。本文在基于Bert作为数据增强的基础上,研究对当前人工智能领域中的一个实用性任务:NL2SQL(即“自然语言转SQL语句”任务)。创新地设计了新型的针对19年发布的首个中文NL2SQL数据集的深度学习模型,并达到了87%左右的准确率,接近了当前State-Of-The-Art模型X-SQL在英文NL2SQL数据集WikiSQL上的表现。
其他文献
介绍了几种分子标记技术,概括了分子标记技术在家蚕遗传育种和品种鉴别中的应用情况,分析了分子标记技术在家蚕遗传育种上的应用前景。
伴随着移动4G网络的到来以及无线网络的大面积覆盖、web3.0的迅猛发展以及智能手机、平板电脑的快速普及,催生了微博客户端(移动微博),并且迅速在全球范围内成长发展。移动微
全光纤Fabry-Perot(F-P)干涉型应变和超声传感器具有体积小、灵敏度高、耐腐蚀等优点,在结构健康监测、医学超声诊断、水声探测等领域具有重要的应用。本文通过对近年来光纤
在盛夏时节高温条件下,用24%帕力特悬浮剂1 250倍、1 667倍、2 000倍药液进行了桑园防治桑蓟马试验,结果表明:不同浓度间药效差异不显著,喷药后4d防治效果均可达到90%以上,用24%