情感词库构建与网络新词发现算法的研究

被引量 : 0次 | 上传用户:talenthers312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务、社交网络的蓬勃发展,网络微博这一时下最为流行的新媒体,正成为广大网民交流思想、发表看法、畅谈心情、评论时事的主要平台,而且也逐渐转变为各类商家了解需求、抢占市场、争夺客户的前沿阵地。微博中涌现的大量个体主观信息对于市场需求、行为预测、观点分析、人机交互等诸多领域都有着极其重要的现实意义。针对这一实际,网络情感倾向性分析这一关键技术应运而生,通过对网络中出现的各类信息进行文本分类、文本聚类、文本检索、信息抽取等多项分析处理,从庞杂的信息浪潮中获取有价值的信息,快速形成体现当前主流观点、反映商业发展趋势、预测社交流行动向的多种情感倾向性数据,满足各类人群的不同需求。研究认为,中文情感词库是中文情感倾向性分析的数据基础,情感词库构建的好坏能够直接影响甚至制约情感倾向性分析过程的时效性以及分析结果的可靠性。然而,目前中文情感词库不同程度地存在着收录情感词语数量偏少、情感类别划分不准、情感极性描述单一的问题。而且,随着互联网的广泛应用,网络语言层出不尽,产生了许多旧词新义的词汇,对情感词库的构建也产生了很大影响。因此,如何发现这些旧词新义词汇意义的变化,是现在情感词库构建的关键技术之一。针对上述问题,本篇论文主要研究内容和特点如下:1.介绍了基于本体的情感词库设计与实现的过程。针对目前已有的中文情感词库中存在的问题,本文自行设计的情感词库在体系架构、编码方式等方面进行了改进,突出了对细粒度情感的描述,更接近于人类的情感倾向,同时,设计的词库自学习扩展功能,还实现了对词语知识库的及时更新。最后,通过实验验证了该方法的可行性。2.阐述了网络“旧词新义”新词的发现算法。本文以自行构建的情感词库为基础,重点对网络微博中容易引起“语义模糊”的网络新词发现问题进行了研究,提出了三步网络新词识别算法,以实验验证了该算法对提高现有系统网络新词识别准确率的有效性。
其他文献
随着热轧板材厚度越来越薄,其在汽车制造、家用电器、集装箱、涂层板、优质焊管、镀锌板和建筑工业等方面获得了广泛应用,热轧薄板材在部分制造业替代传统的冷轧板材已成为一
[背景]心脑血管疾病是世界范围内人口死亡的主要原因。氯吡格雷(波利维)因其有效的降低心脑血管疾病的发病风险和死亡率及更好的安全性,成为目前世界范围内最常使用的抗血小
<正>排污许可不仅是行政许可,还内含完整的制度体系;排污权不属于物权、准物权或排污许可制度是主管机关根据企事业单位和其他生产经营者的申请,经依法审查,允许其按照许可证
随着国家财政体制改革的不断深化,财务绩效评价已经成为行政单位财务管理的重要内容,人们开始更多地关注财务绩效评价风险。文章结合风险管理,论述行政单位财务绩效评价的主
目的:探讨分析初产妇乳汁不足的中西医结合营养护理效果。方法选取我院2010年1月-2014年6月收治的90例初产妇乳汁不足患者,随机分为观察组与对照组,各45例。观察组患者给予中西
本文分析了用于多元红外探测器封装的微型杜瓦瓶的三种结构形式,并分析了其漏热,电学性能和工艺性,通过比较对今后我国红外探测器封装技术作出预测。
逆境胁迫是制约植物正常生长发育的重要因素,探索植物应答逆境胁迫的分子机制也是人们长期探索的重要课题。随着模式植物基因组测序工作的完成,植物学的研究也进入了功能基因
本文系统研究了微膨胀上向流生物活性炭工艺对有机物的去除特性和机理、微生物活性及影响因素、微生物学特征、生物降解动力学模型和工程应用效果,主要研究成果如下:1.研究了活
特征标志光电检测技术作为光电技术的一个重要部分,广泛应用于印刷包装的彩色印刷套色质量检测与控制、包装膜、密封膜和封条膜的分条纠偏控制、包装封切控制、物品、距离等
智能上肢可以帮助上肢残疾者进行获取食物、使用工具等运动,但智能假肢的控制是亟待解决的一个问题,从神经信号中解析出肢体的运动信息,用截肢者的主动意识来控制假肢是智能假肢