基于融合特征的微博主客观分类方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:xiaoshang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的用户喜欢通过微博来实时分享自己的观点或者表达自己的情感,因此,面向微博的意见挖掘或情感分析成为了研究热点。其中,微博主客观分类研究是意见挖掘和情感分析研究的基础,其主要任务是区分微博中表达主观观点的文本和表达客观事实的文本,并进一步从主观性文本中挖掘潜在有价值的信息。此外,面向微博的主客观分类研究对意见问答系统、观点摘要等工作也具有重要意义。本文针对中文微博的主客观分类问题,分别研究了语法和语义特征结合不同特征选择方法对微博主客观分类的影响,同时对基于融合特征的微博主客观分类方法进行了探索性研究。本文主要研究成果如下:(1)针对语法特征,提出了基于2-gram的词、词性特征的提取算法。本文借鉴2-gram模型分别提取了微博文本的连续双词(2-word)、连续双词词性(2-pos)组合模式特征作为语法特征来进行微博主客观分类研究。(2)针对语义特征,充分考虑了情感分析经验以及微博文本特点,提出了微博内容特征、比重特征等丰富的语义特征,并引入了微博文本情感词库来进行微博主客观分类研究。(3)针对微博文本特征选择问题,分别对两类特征选择方法进行了分类性能比较。本文分别利用不同特征选择方法对语法和语义特征进行评估来获取最优特征集,并结合分类模型对分类效果进行了比较。(4)针对微博主客观分类问题,提出了一种基于融合特征的微博主客观分类方法。该方法通过设计特征融合算法对不同特征选择方法进行有效组合来获取融合特征,并结合机器学习方法来进行微博主客观分类研究。本文研究构建了更丰富的主客观分类特征,并设计了一种特征融合算法来探索特征选择方法组合后对主客观分类效果的影响。实验证明,本文提出的特征融合算法可以有效提高主客观分类效果,同时构建了相对通用的主客观分类模型。
其他文献
人脸识别技术应用背景广泛,可用于身份识别、人脸的视频检索以及人机交互等诸多领域。这些巨大的应用前景使得人脸识别技术越来越多的成为当前模式识别和人工智能领域的一个
随着网络技术、信息技术的发展,工作流技术日益成为当前信息领域的一个焦点,并成为办公自动化系统的核心技术之一。笔者通过对工作流的基本理论和建模技术的深入分析和研究,
本文对入侵检测系统中高效模式匹配算法进行了研究。文章首先分析了入侵检测系统中常用的模式匹配算法,并通过实验方法对BM算法、AC算法和WM算法进行了性能对比,讨论了这三个算
近年来,在金融服务、网络监控、电信数据管理及传感器检测等领域中,出现了一类新的数据密集型应用。这类应用的特征是:数据以大量、快速、时变的数据流形式持续到达,所以数据不宜
数据集成平台的作用是提供一个访问异构数据源的统一接口,使开发人员不必考虑数据模型的异构性、数据抽取、数据合成等问题。本文以电力系统领域数据现状和对数据集成的要求
随着互联网的快速发展和宽带网络的逐步普及,流媒体最近几年成为了发展的热点,而视频点播系统(VOD系统)则是目前流媒体应用的主要表现形式之一。各种形式的VOD应用将给INTERN
多标记学习是机器学习领域中的重要研究方向之一,它能够直观地反映多义性对象所具有的多种语义信息,其学习的任务是为待学习样本预测其对应的类别标记集合。近年来,研究学者
WWW和流媒体是现今Internet上最流行的两种应用。通过WWW网络用户可以很迅速、方便地取得丰富的信息资料,包括数字音频和视频文档资料。近年来,流式网络多媒体正获得越来越广
随着人类社会生活对Internet需求的日益增长,网络安全逐渐成为Internet及各项网络服务和应用进一步发展所需解决的关键问题。入侵检测作为一种积极主动防御的网络技术,已经成
冰层厚度历来是冰情检测中的重要指标之一,及时准确的了解冰层厚度可以有效预防冰凌等自然灾害,为冰上作业提供安全保障。近年来,随着电子和计算机技术的发展,对于冰层厚度测