【摘 要】
:
近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部
【机 构】
:
北京林业大学信息学院,国家林业草原林业智能信息处理工程技术研究中心
【基金项目】
:
自然保护地生态监测系统(2018HXKFXX018)。
论文部分内容阅读
近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部分标签数据进行命名实体识别,提出了一种基于部分标签数据和经验分布的方法。首先介绍基于部分标签数据的建模方法,然后引入标签经验分布的假设,通过将经验分布加入模型,有效降低了数据中的噪声。最后分别在植物病虫害数据集和优酷视频数据集上进行测试,结果表明,该方法优于其他方法。
其他文献
一、对美术新课程标准的理解 自实施新课程以来,学校组织教师采取多种方式,认真学习,结合课改以前的教学理念所采用的教学方法,比较对照、深刻领会、更新观念。美术学科具有与其他学科不同的特点,对新课程标准的理解有以下几点: 1.美术课程突出体现基础性、普及性和发展性,使美术教育面向全体学生,不同的学生在美术教育上得到不同的发展。美术内容是现实的、有意义的、富有挑战性的,更加有利于学生主动地进行观察、
该文探究手术操作术语归一化方法的构建。首先,分析手术操作术语归一化数据集的特点;其次,调研术语归一化的相关方法;最后,结合调研知悉的技术理论方法和数据集特征,建立手术
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上