【摘 要】
:
随着互联网信息技术的迅猛发展,文本数据出现爆炸式增长。面对繁杂的文本信息,如何有效地管理和分类文本数据,帮助用户快速、准确、全面地找到所需的信息,是一个很有意义的研
论文部分内容阅读
随着互联网信息技术的迅猛发展,文本数据出现爆炸式增长。面对繁杂的文本信息,如何有效地管理和分类文本数据,帮助用户快速、准确、全面地找到所需的信息,是一个很有意义的研究课题。文本分类是自然语言处理领域中一个重要而经典的问题,在各个领域都有广泛的应用。在生物医学领域,生物医学文本分类是一项基础性的工作,对生物医学文献分门别类有助于研究人员快速获取目标信息。现有的文本分类方法没有充分利用生物医学文献的层次语义结构,从而影响了生物医学文献的分类效果。本文根据上述内容,进行了如下研究工作:(1)根据生物医学文本中具备的层次结构,本文应用层次注意力机制来建模文档。具体来讲本文运用了三个层次的注意力机制:单词与单词之间、句子与句子之间以及摘要的不同结构之间。通过层次注意力机制,融合全局和局部的上下文信息,得到文档的特征表示。(2)针对文本分类问题中经常存在的类别不平衡问题,本文应用代价敏感学习方法来缓解此类问题对分类性能的不良影响,并提出自适应的方法,通过迭代的方式自动地学习最佳的类代价参数。该方法从一定程度上提高了分类模型的性能。(3)为进一步改进分类模型的性能,本文应用基于语法解析树的图神经网络捕获文本中的语法约束,从而获得更好的文本表示,进而提高生物医学文本分类任务的效果。通过实验验证,本文所提出的文本分类模型取得的效果在一定程度上优于其他已有模型的结果。另外,本文提出的自适应类代价学习方法,可以用于解决其他任务/问题中的类别不平衡问题。
其他文献
物联网智能节点一般采用电池供电。对于长时间工作需求的应用,需要大容量电池才能保证其长期稳定工作,显然提高了节点的应用成本。延长智能节点的使用寿命可以通过降低电路节
在国家大力鼓励大众创业相关的政策背景下,全国各地各行业都掀起了创新创业的热潮,创新创业既能为企业自身带来可观的经济收益和远大的发展前景,又能带动就业,解决系列社会问
研究分析表明环境气体监测问题已逐渐成为人们日益关注的重点,利用机器人主动嗅觉技术对这一问题的研究具有重要的意义。如何利用旋翼无人机自主完成三维空中气体的感知、跟
服役环境中的温-湿度变化会在混凝土内部产生对应的温-湿度响应,该响应与各类混凝土耐久性问题息息相关。此外,由于四季交替、昼夜循环等原因而产生的环境周期性温-湿度变化,
进入21世纪以来,互联网的蓬勃发展推动了各种电子商务平台的诞生。这些平台上发布的在线评论文本所包含的情感倾向有着特别重要的意义,可以帮助用户商家进行有效决策,而单单
随着材料制备及冶金过程的发展,金属气体相关热力学性质的研究受到越来越多的关注。作为一类特殊的金属,碱金属具有较低的熔沸点,广泛应用于工业中。压缩因子(Compressibilit
以人工智能、大数据等技术为基础的智慧教育是当今教育的发展方向,智慧教育的核心是个性化教育,即以学生为中心,围绕学生的学习需求开展教学工作。但是目前个性化教育在导学
聚酯纤维的适用范围日益广泛,市场需求量不断增长,生产规模急速扩大,使得聚酯纤维生产厂家之间的竞争日益激烈。随着高新技术产业的迅猛发展,聚酯纤维行业也开启了一个新的纪
由于原油性质、产品要求等因素变化,石化生产单元的实际操作常常偏离设计工况,造成能耗提高、产品分布变差等一系列问题。如何适应工况变化,在不改变流程和设备的条件下,契可
膜蒸馏技术是一种利用疏水性的微孔膜并以膜两侧温差为推动力使得热侧挥发性物质穿过膜孔在冷侧冷凝富集的一种物理分离技术,是膜技术中一种有效分离有机废水中氨氮、苯酚等