情感词库构建与网络新词发现算法的研究

被引量 : 0次 | 上传用户：talenthers312

【摘要】

：

随着电子商务、社交网络的蓬勃发展，网络微博这一时下最为流行的新媒体，正成为广大网民交流思想、发表看法、畅谈心情、评论时事的主要平台，而且也逐渐转变为各类商家了解需求、

【作者】

：

刘哲

【发表日期】

：

2013年期

【关键词】

：

社交网络情感词库新词识别准确率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着电子商务、社交网络的蓬勃发展，网络微博这一时下最为流行的新媒体，正成为广大网民交流思想、发表看法、畅谈心情、评论时事的主要平台，而且也逐渐转变为各类商家了解需求、抢占市场、争夺客户的前沿阵地。微博中涌现的大量个体主观信息对于市场需求、行为预测、观点分析、人机交互等诸多领域都有着极其重要的现实意义。针对这一实际，网络情感倾向性分析这一关键技术应运而生，通过对网络中出现的各类信息进行文本分类、文本聚类、文本检索、信息抽取等多项分析处理，从庞杂的信息浪潮中获取有价值的信息，快速形成体现当前主流观点、反映商业发展趋势、预测社交流行动向的多种情感倾向性数据，满足各类人群的不同需求。研究认为，中文情感词库是中文情感倾向性分析的数据基础，情感词库构建的好坏能够直接影响甚至制约情感倾向性分析过程的时效性以及分析结果的可靠性。然而，目前中文情感词库不同程度地存在着收录情感词语数量偏少、情感类别划分不准、情感极性描述单一的问题。而且，随着互联网的广泛应用，网络语言层出不尽，产生了许多旧词新义的词汇，对情感词库的构建也产生了很大影响。因此，如何发现这些旧词新义词汇意义的变化，是现在情感词库构建的关键技术之一。针对上述问题，本篇论文主要研究内容和特点如下：1.介绍了基于本体的情感词库设计与实现的过程。针对目前已有的中文情感词库中存在的问题，本文自行设计的情感词库在体系架构、编码方式等方面进行了改进，突出了对细粒度情感的描述，更接近于人类的情感倾向，同时，设计的词库自学习扩展功能，还实现了对词语知识库的及时更新。最后，通过实验验证了该方法的可行性。2.阐述了网络“旧词新义”新词的发现算法。本文以自行构建的情感词库为基础，重点对网络微博中容易引起“语义模糊”的网络新词发现问题进行了研究，提出了三步网络新词识别算法，以实验验证了该算法对提高现有系统网络新词识别准确率的有效性。

其他文献

棒状激光热轧板材板形检测方法试验研究

随着热轧板材厚度越来越薄,其在汽车制造、家用电器、集装箱、涂层板、优质焊管、镀锌板和建筑工业等方面获得了广泛应用,热轧薄板材在部分制造业替代传统的冷轧板材已成为一

学位

棒状激光热轧板材板形检测试验研究

氯吡格雷药物基因在缺血性卒中和急性冠脉综合征病人中的观察性研究

[背景]心脑血管疾病是世界范围内人口死亡的主要原因。氯吡格雷(波利维)因其有效的降低心脑血管疾病的发病风险和死亡率及更好的安全性,成为目前世界范围内最常使用的抗血小

学位

氯吡格雷抵抗血小板活性CYP2C19缺血性事件

排污许可与排污权的法律性质辨析

<正>排污许可不仅是行政许可,还内含完整的制度体系;排污权不属于物权、准物权或排污许可制度是主管机关根据企事业单位和其他生产经营者的申请,经依法审查,允许其按照许可证

期刊

排污权交易契约性排污许可用益物权法律性质

试论行政单位财务绩效评价中的风险管理

随着国家财政体制改革的不断深化,财务绩效评价已经成为行政单位财务管理的重要内容,人们开始更多地关注财务绩效评价风险。文章结合风险管理,论述行政单位财务绩效评价的主

期刊

行政财务绩效评价风险管理

初产妇乳汁不足的中西医结合营养护理

目的：探讨分析初产妇乳汁不足的中西医结合营养护理效果。方法选取我院2010年1月-2014年6月收治的90例初产妇乳汁不足患者，随机分为观察组与对照组，各45例。观察组患者给予中西

期刊

乳汁不足中西医结合营养护理

红外探测器封装微型杜瓦瓶结构与分析

本文分析了用于多元红外探测器封装的微型杜瓦瓶的三种结构形式，并分析了其漏热，电学性能和工艺性，通过比较对今后我国红外探测器封装技术作出预测。

期刊

红外探测器杜瓦瓶结构分析

转录组学在植物应答逆境胁迫中的研究进展

逆境胁迫是制约植物正常生长发育的重要因素,探索植物应答逆境胁迫的分子机制也是人们长期探索的重要课题。随着模式植物基因组测序工作的完成,植物学的研究也进入了功能基因

期刊

非生物胁迫生物胁迫转录组差异表达基因

微膨胀上向流生物活性炭工艺特性及应用研究

本文系统研究了微膨胀上向流生物活性炭工艺对有机物的去除特性和机理、微生物活性及影响因素、微生物学特征、生物降解动力学模型和工程应用效果，主要研究成果如下：1.研究了活

学位

微膨胀上向流生物活性炭生物膜模型

模具特许连锁网格化制造系统的物流规划与供货策略分析

特征标志光电检测技术作为光电技术的一个重要部分,广泛应用于印刷包装的彩色印刷套色质量检测与控制、包装膜、密封膜和封条膜的分条纠偏控制、包装封切控制、物品、距离等

学位

线阵CCD光电传感器特征标志检测边/线标志检测印刷标志检测自动增益控制差动对比度提升浮动阈值C8051F023单片机CPLD

灵长类动物脑认知实验研究系统的设计与实现

智能上肢可以帮助上肢残疾者进行获取食物、使用工具等运动，但智能假肢的控制是亟待解决的一个问题，从神经信号中解析出肢体的运动信息，用截肢者的主动意识来控制假肢是智能假肢

学位

脑认知实验装置机械设计控制系统单片机

情感词库构建与网络新词发现算法的研究

其他学术论文