【摘 要】
:
传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步
【机 构】
:
中国电子科技集团公司第三十六研究所,西北农林科技大学信息工程学院
【基金项目】
:
陕西省自然科学基金项目(2017JM6059),中央高校基本科研业务费专项资金资助项目(2452016081),中国博士后基金(2017M613216),陕西省博士后基金(2016BSHEDZZ121).
论文部分内容阅读
传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分
其他文献
架结构混凝土浇筑的相关材料、机具准备、质量要求及施工工艺。
啤酒中双乙酰含量超过0.1mg/L。会产生不愉快的馊饭味或奶油味。双乙酰被认为是衡量啤酒成熟与否的关键性指标。本文分析了影响啤酒中双乙酰含量的因素,从而总结出降低双乙酰的
我经常去北京植物园锻炼,有一次路过竹园发现,成片的竹林边上的竹子都喜欢往外长。后来再去竹园,发现工作人员用粗壮的绳索试图拉回这些“歪身浪子”,但其中的一些竹子拼命往外就
针对以往水泥浆体系失水性能不稳定而造成施工耽搁的情况,本文从提高水泥浆体系性能入手,通过室内试验,研制出一种失水量小、稠化性能可调的新型水泥浆体系,目的是为满足新疆
前言二甲基硫(DMS)在啤酒中的阈值为30~50μg/L,会给啤酒带来一种令人不愉快的类似煮熟蔬菜的味道,被认为是对啤酒风味影响较大的硫化物之一.
用电感耦合等离子体原子发射光谱(ICP-AES)对市售附子中Cu、As、Cd、Cr、Pb等5种重金属元素的进行检测,并进行方法学研究。该方法过程稳定,数据准确性较高,符合检测要求,可以