【摘 要】
:
由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用机器阅读理解模型,从互联网语料中抽取出高质
【基金项目】
:
上海市科技创新行动计划(19511120400)。
论文部分内容阅读
由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果。实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10%左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能。
其他文献
甘蓝类蔬菜主要包括结球甘蓝(包菜)、花椰菜(白花菜)、青花菜(西兰花)3种,因适应性强、种植方式相近,在我国各地均有栽培,且多采用育苗移栽方式。江苏省甘蓝类蔬菜年种植面积
[摘 要]文化作为区别不同民族、国家的特定标识,凝聚着一个民族和国家的历史底蕴、人文特质和精神风貌。对本民族、国家的文化认同实际上是一个构建文化家园、宣示文化归属、寄寓文化情韵的过程,有利于维护国家统一和促进民族团结。青年群体是我国社会人群的重要组成部分,是实现中华民族伟大复兴的中坚力量。因此,提升当代青年的文化认同感是推动中华优秀传统文化创新性发展与创造性转化乃至于建设文化强国、实现中华民族伟大
针对现有无线可充电传感网络的节点优化部署方法中存在的收信能量估计模型未考虑实际商用天线的定向辐射特征、优化目标未考虑节点部署方式对定位精度和覆盖程度的影响、节点
利用槽探、钻孔等探矿手段,共揭露出4条金矿体,矿石类型全部为碎裂蚀变岩型。老岭断裂带或其次一级韧、脆性断裂为区域主要控矿构造,F03断裂破碎带为区内的主要控矿、容矿构
目的:探讨急性ST段抬高型心肌梗死(STEML)患者进行基于胸痛中心的优化式院前急救护理的效果。方法:选取72例STEMI患者,并分为观察组和对照组各36例。对照组按照常规院前急救
[摘 要]高校可以从实验室安全管理工作涉及的综合性管理、通用性安全管理、专业性安全管理三个方面入手,对高校安全管理工作进行探索与改革。加强实验室安全的管理,可促进高校实验室安全文化的形成,为师生营造一个和谐的工作和学习环境,为高校实验教学提供保障。 [关键词]实验室;安全;管理 [中图分类号] G482 [文献标识码] B [文章编号] 2095-3437(2021)05-0196-03 高
在互联网技术飞速发展的今天,为了提升企业的经营效率、降低管理成本,越来越多的企业致力于投入资金和人力建立符合自身业务需要的信息系统。在企业级信息系统的设计思想领域
为充分利用淮北选煤厂稀缺主焦煤资源,提高企业经济效益,以该选煤厂重介中煤为研究对象,探索了中煤再选的可行性。基于重介中煤煤质特性和解离特性,将中煤破碎至<0.5 mm以下,
眼下正值春季,風大雨少,气候干燥,动辄就会上火。不同于夏季的“湿热”,春节上火更多是“燥热”,症状有如咽干疼痛、眼睛干涩、鼻腔火辣、嘴唇干裂、食欲不振等。豆芽不仅能帮助五脏从冬藏转向春生, 还具有清热的功效,有利于肝气疏通、健脾和胃。以绿豆芽为例,其每百克热量仅18千卡,具有清热利水功效。 传统的豆芽是指黄豆芽,后来市场上逐渐开发出绿豆芽、黑豆芽、豌豆芽、蚕豆芽等新品种。虽然豆芽菜均性寒味甘,但
深化供给侧结构性改革需要有效的产业政策支撑。从微观层面研究产业政策如何影响企业绩效并找到提升路径具有重要理论意义和实践价值。通过文献综述的形式,总结了产业政策、