论文部分内容阅读
随着计算机和网络通信技术的迅速发展,Internet为公众舆情的表达和传播提供了新的途径,越来越多的人们通过网络来表达自己对社会新闻热点的意见和看法。然而,由于网络信息以惊人的速度增长,难以采用人工阅读的方式获得人们对某一话题的情感倾向,如何基于文本情感分析网络舆情是一个具有良好应用和推广价值的研究课题。论文采用点面相结合的方式展开应用研究。首先从点入手,分析文本的情感倾向性;然后结合舆情相关理论,由点层次上升到面的层次——话题。在整个面的层次上,结合话题参与者的情绪进行综合分析。进而,将情绪作为舆情分析的一个要素,作用到舆情态势的分析中去。通过本课题研究,力图发现情绪在舆情分析中的作用,并提出可行的识别分析技术,然后基于此研究并设计一个基于文本情感的舆情分析系统。从总体上看,论文研究内容及创新性工作主要包括:(1)对网络舆情分析、文本情感分析国内外研究现状进行了综述。(2)对系统设计与实现相关技术如网络爬虫、设计工具、实验对象等展开分析,最后确定采用Java语言及MySQL数据库进行设计和实现,通过网络爬虫技术抓取论坛所需要的评论信息,然后使用Lucene工具对数据库信息建立索引。(3)详细介绍了根据用户输入的关键字检索,在界面上以表格的方式显示关联此关键字的所有主题信息,用户点击某一主题,会以浏览器的方式显示此主题链接。点击情感分析会对此主题的评论信息进行情感分析算法,然后以图表的形式展现出来。(4)详细介绍了基于文本的情感知识获取是对论坛(BBS)、即时通信软件(IM)、博客(Blog)上的文本内容的理解,达到利用社会计算环境下的文本交互信息挖掘蕴涵其中的情感知识的目的,作为对生物生理信号分析的补充手段。这一研究内容以文本的分析作为基础,包括对文本语法语义的分析、情感相关词语的提取、情感程度的表达以及情感语言的模糊处理等,最终试图得到以文本为输入的情感自动分析机。最后,在完成系统设计后,对各部分模块进行了详细实现,通过实现原型系统验证了算法及设计的有效性,实验结果表明该系统具有较好的情感分析效果,具有一定的推广应用价值。