中文社交网络短文本情感分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:yehyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的井喷式发展使得社交平台短文本正以爆炸式的速度产生,然而传统文本分析方法难以应对短文本的稀疏性、随意性与热词性,且大部分应用深度学习的短文本分析都是针对英文语料,如何高效地分析、提取中文社交网络短文本的情感倾向具有不可估量的商业和社会价值。本文首先系统分析了传统文本情感分析模型,将词典方法与机器学习模型结合,完成情感分类器的训练。发现词典方法并不适用于简短随意的短文本,且传统方法数据预处理阶段滤除表情字符,造成重要情感特征的缺失。本文引入深度学习模型,结合社交网络短文本的特点,提出面向中文社交网络的短文本情感分析新机制。一方面使用word2vec工具训练词向量,提取短文本的语义特征,另一方面保留、提取微博文本中的表情字符,作为情感特征,共同构成多维特征集合;再通过卷积神经网络模型挖掘深度抽象特征,最终训练分类器完成情感分类任务,解决传统方法难以对短文本有效建模、分析的问题。实验结果表明,表情字符的融入使得情感分析准确率相对提高2.62%;此外,相比基于词典的机器学习模型,基于卷积神经网络的多维特征情感分析新机制将情感分析准确率与F度量分别相对提升21.29%和19.20%。
其他文献
由P W M整流器和P W M逆变器组成的变频器称之为双P W M变频器或AFE(Active Front End),可实现能量双向流动,能够提高电能的利用率,把由电动机产生的再生能源回馈到交流电网,
在"建设新江苏"的宏伟蓝图下,分析江苏省终身教育发展现状,探索终身教育体制建设和体系建设,以教育信息化视角审视信息化在现代教育体系中的重要作用,构建"建设新江苏"所需的终身
Daintain(大炎肽)是1994年由Chen等从猪的小肠中分离纯化出的一种新的生物活性蛋白,其氨基酸序列与1995年由Utans等人在大鼠心脏移植排斥反应中克隆出的巨噬细胞因子Allograf
以硝酸铈铵(CAN)为引发荆,采用水溶液聚合法.制备了阳离子瓜尔胶与丙烯酰胺的接枝共聚物(pAAm—g—cG40)。将制得的接枝共聚物作为阳离子絮凝剂,应用于生活污水的净化处理。结果表明
当生产力发展到一定程度的时候,在高速的经济趋势的带动下,技术就开始了它自身发展脚步。最近这几年,我们国家在很多领域都出现了与之相对应的技术。其中工作中用到的人机识别体系的发展,为我们开展工作提供了非常有利的帮助,笔者基于这种背景环境重点的分析了以马赛克图形为基础的人机识别体系。
目前,我国经济正开始走向一个新的时代,“房住不炒”的定位决定了未来房地产行业的发展方向,政策的改变影响着房地产项目的投融资决策.论文理论联系实际,为房地产项目前期咨