【摘 要】
:
文本情感分析作为自然语言处理领域相关研究内容之一,从不同粒度判别自然语言中所表达的情感都具有重要研究意义。为此,本文针对现有模型在不同文本情感分析任务中的不足,进
论文部分内容阅读
文本情感分析作为自然语言处理领域相关研究内容之一,从不同粒度判别自然语言中所表达的情感都具有重要研究意义。为此,本文针对现有模型在不同文本情感分析任务中的不足,进行深入研究,具体如下:1.考虑到现有文本情感分析模型仅采用语义词向量,卷积神经网络仅提取文本局部特征等问题以及词向量和卷积神经网络作为句子级别情感分析任务中的关键技术,研究利用语义词向量,情感词向量以及词典词向量表征文本,并通过提取单词上下文信息消除单词歧义。在CNN模型基础上利用LSTM attention,attentive pooling以及attention vector三种注意力机制提取文本全局特征,给出三种attention CNN模型。并进一步通过引入cross-modality consistent regression融合方法以及迁移训练方法提高模型性能。在多个数据集上对给出的模型进行验证,对比结果验证了模型的有效性。2.针对现有模型仅能完成简单句式中实体情感分类问题,研究利用动态忆网络,通过优化其输入模块,问题模块以及记忆模块将该实体级别情感分类任务建模为问答系统。输入模块通过引入单词位置信息以及残差结构以建立更有效的输入表示。为解决实体词过长情况,问题模块设计相应的实体问题,通过GRU进行编码得到实体编码向量替代简单平均实体词向量。记忆模块通过attention based GRU结构和inner attention GRU结构消除原始soft attention结构在每次提取记忆信息时所产生的权重偏置问题。通过记忆更新机制从多跳记忆信息中提取出与实体相关的情感特征。实验结果显示所给出的模型在多个数据集上可以取得较好分类效果,证明模型可以识别复杂句式中实体情感类别。
其他文献
摘 要:近些年来,我国的计算机技术发展的速度可谓是突飞猛进,不但生产出很多先进的计算机信息技术,同时还将这些信息技术应用到社会的各个领域之中,发挥出巨大的作用。带外网络存储虚拟化模型是计算机技术中的重要组成部分,是降低企业存储成本的重要技术。这种技术具有更好的性能和优点,是企业中更趋向运用的计算机信息技术。但是,这种带外虚拟化存储系统在安全性能方面是比较脆弱的,很容易受到外部攻击。这就促使人们寻求
永昌县地处河西走廊东部,祁连山北麓、阿拉善台地南部,县内光热资源丰富,光照时间充足,灌溉水资源多以祁连山融化的冰川雪水和地下水为主,发展高原无公害蔬菜具有得天独厚的
珐琅工艺是一种拥有悠久的历史且随着时代变迁不断发展精进的工艺类型。在历史发展的长河中,伴随着科技技术的发展提高,珐琅工艺的技艺也在传承中不断向前发展,珐琅工艺逐渐显露出工艺自身独特的魅力。并在特定的历史时代中达到鼎盛时期,具有极强的影响力和艺术感染力。珐琅工艺具有变化多端的绚丽色彩,可以塑造不同的色彩肌理效果,更能充分表现绘画性的色彩效果;珐琅工艺具有高度的造型可塑性,材质相互结合的广阔空间;更具
本文报道1例67岁患自身免疫性血小板减少的男性病例,随后发现患者为华氏巨球蛋白血症(WM)。为此作者对1993年~1999年诊断为WM的104例病案进行了回顾性调查,确认其中还有3例属自
地质勘探工程测量是地质勘查工作中的一项重要的基础工作,已成为地质勘查工作中不可分割的一部分。它要求勘探人员在勘探过程中仔细、认真,时刻保证数据的正确性。随着科技的
近年来,并购重组已成为上市公司做大做强的主要路径。无论是传统行业,还是新兴行业,越来越多的上市公司认识到通过并购重组来实现企业做大做强、实行转型升级的必要性。上市公司并购重组普遍呈现高溢价估值、高业绩承诺、高商誉的特征。上市公司如果是为了增强自身竞争优势、为了公司持续健康发展,为了给广大投资者带来满意的投资回报,合理的高溢价估值并购重组无可厚非。但是研究发现,相当一部分高溢价估值的背后存在着上市公