【摘 要】
:
在互联网飞速发展的今天,海量的文本数据在网络上共享传输,文本的自动分析处理成为一个研究热点,而文本中包含情感的获取对于语义的理解有着直接作用,情感知识库在这一工作中
论文部分内容阅读
在互联网飞速发展的今天,海量的文本数据在网络上共享传输,文本的自动分析处理成为一个研究热点,而文本中包含情感的获取对于语义的理解有着直接作用,情感知识库在这一工作中是不可或缺的资源。只有建立起正确有效的情感知识库,才能为后继的情感分析工作提供坚实的基础。本文的主要工作和贡献如下:论文首先对现有语义知识库的结构进行详细研究,根据现有知识库的构建特点,以及对情感分类的深入研究,结合情感分类以及语义分类建立了新的中文情感知识库构架,设计了情感知识库的组织结构和情感知识描述体系,并给出了情感知识库的应用实例。本文着重研究了情感知识库中知识的自动生成,其中包括基础情感词典的生成,同义词集合的DEF定义,褒贬计算,以及情感分类和多情感词汇的处理。最后本文通过将未登录词进行概念切分以及自动生成语义表达式,实现了情感知识库的自动扩充。应用文中构建的情感知识库,研究了文本情感倾向性分析的问题。改进并引入知网的情感倾向判断算法,根据知识库重新选择了情感种子词组,并利用情感知识库中的同义词集合扩大种子词的语义覆盖面,补充了常用方法中种子词语义覆盖不足的缺点。最后,通过实验验证了算法的合理性,以及中文情感知识库的现实应用意义。
其他文献
该文对分布式对象技术和AIIM新发布的DMA1.0标准进行了介绍,对Document Broker 的管理对象SGML文本也作了简要说明.并分析了Document Broker这套开发工具的主要特色 和基本原
本课题的研究以作者所属实验室正在进行的GB18240.7税控商业自动化管理系统为背景,提出并详细介绍了一种基于Altera SOPC技术的嵌入式系统设计方法,并结合网络税控器系统进一步
随着我国移动用户日趋饱和,市场竞争越加激烈,用户流失状况也更加突出。而电信企业经过多年的系统建设和运维管理,现已累积大量用户数据,通过分析在网用户的消费习惯、所用业务特
计算机体系结构领域已大步迈入异构时代,异构架构已广泛存在于服务器、个人电脑、嵌入式终端等系统中,在越来越多的应用领域大显身手。加速器微结构的多样化,是异构时代的重要特
无线射频识别(Radio Frequency IDentification,RFID)技术已经得到了越来越多的应用。在这些应用中,RFID阅读器会实时地采集大量包含监控对象时间、位置和状态信息的标签数据,这
在高速发展的信息时代,网络安全问题已成为影响企业生产力和收入的重要因素之一。大多数企业曾遭受过网络攻击,导致了机密信息的泄露。应对层出不穷的网络安全问题,当前网络准入
目前的动态路由方法周期性地采样网络参数.由于呼叫到来的随机性和传输与处理的延时,使决策的作出在整个采样间隔内落后于采样时刻,导致它们均只是准实时的,从而影响决策的准
该文重点讨论邮政综合网主机应用系统互边互操作的应用需求,概要描述了90年代以来企业计算领域应用系统互连互操作技术的主要发展;讨论分布计算与通讯技术的基础理论,给出网
微处理器的硅前性能验证是在处理器芯片生产之前的重点工作内容。通过对处理器设计的各项性能指标进行测试分析,发现出存在的性能缺陷并予以改进,从而确保处理器最终实际性能符
全局光照技术是图形学领域的研究热点之一。传统的全局光照算法如路径追踪,辐射度,光子映射等存在计算量大,收敛速度慢等问题。多光源渲染技术将全局光照下的渲染转化为虚拟点光