高校学生的微博情感分析

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:jica330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,互联网进入了web2.0时代。在这个日新月异的网络发展浪潮中,人们沟通的渠道从传统的电子通讯产品转向方便快捷的社交媒体,如微博和微信。由于微信用户面对的是现实生活中的朋友圈,这导致人们发送微信内容时往往有所顾虑。而微博用户面对的是虚拟网络,所以博文内容拘束性弱,更能反应人们的真实情感和观点。作为高校学生常用的社交软件之一,微博也为大家了解高校学生生活、学习、心理等状态提供一种有效的渠道。因此,如何有效地提取和挖掘蕴含在海量博文中的情感信息是一项很有意义的研究。目前国内学者对于博文的情感分析,主要是针对某一热点话题的舆情分析。本文主要是通过博文的情感分析探索某高校学生的兴趣点和心理健康问题,结合统计方法和机器学习方法研究该高校学生微博情感特点,并建立异常博文情感的识别系统。所提的方法可应用于国内各高校学生的博文情感研究。本文数据是通过爬虫技术从某高校官方微博中随机抽取学生的博文信息。论文结构如下:第二章通过从博文中的关键词提取,发现不同学历学生的博文内容存在差异,本科生和硕士生的文本常用词汇十分接近,但博士生与前两者差异较大。第三章改进了文本分词,构建词向量,使用主成分分析对词向量降维并计算合成词的与情感词典中的词汇相似度,最终量化这类合成词的感情色彩。第四章构建了预测博文情感的评分卡模型。经过测试集验证,模型的AUC值达到0.86,表明该评分卡模型对微博的情感特征评定具有较高的精确度。第五章分析博文情感分的影响因素,从情感得分挖掘学生们在推送不同主题博文时的情感差异,发现微博的内容和娱乐美食有关时,博文情感得分偏高,和科研学习有关时,博文情感分较低。构建了异常博文情感观察系统,可用于识别有严重心理问题或极端情绪的学生。
其他文献
目的建立青黛UPLC指纹图谱,用于评价其提取工艺。方法采用单因素实验设计,以UPLC指纹图谱的共有峰数目、特征指纹峰总峰面积、有效成分含量为评价指标,分别对影响青黛加热回
早抗京欣是江苏省农业科学院蔬菜研究所2001年以优质自交系20-E为母本,以国外引进的高代自交系20-SG为父本配制而成的一代杂交西瓜,2004年4月通过江苏省农作物品种审定委员会
日新月异的科技进步和瞬息万变的市场环境对企业提出了严峻的挑战,创新是企业提高核心竞争力并保持竞争优势的关键。员工是企业创新的主体,员工创新行为是企业创新绩效的重要
网络购物作为一种便捷的新型购物方式,已经成为人们日常生活的重要组成部分。网络购物的不同之处在于,消费者往往只能根据商家提供的文字、图片介绍以及其他买家的在线评价等
为建立无公害稻米生产方式,研究了有机氮与无机氮比例对水稻产量、稻米品质及稻田地表水铵态氮含量的影响,结果表明:①在等氮量条件下,有机氮占总氮量25%~75%时,水稻产量高于
他塞给我一本书.接过我的《天龙八部》,转身就跑了。我看了看封面,写着《宋词三百首》几个字。我追他,他一溜烟就不见了身影。我和他说好了的.用《.天龙八部》换《雪山飞狐》。这,不