互联网舆情监控系统的设计与实现

来源 :湖南师范大学 | 被引量 : 3次 | 上传用户:mjynht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,互联网上的信息数据呈爆炸式增长,舆情信息的监控将起到非常重要的作用,它能从网络信息中找出低俗的、恶意的或带有诱导性的舆情内容,加强对网络内容的监管。但是由于信息总量庞大,传统的人工监管形式难以实现互联网舆情的有效覆盖,这给互联网安全乃至社会稳定都带来不小的隐患,因此互联网舆情监控系统已经显得迫在眉睫。本论文设计的互联网舆情监控系统针对用户所提出的监控内容要求,在指定的网络范围内,对舆情信息进行处理和分析,在应用界面上为用户提供舆情情况和趋势分析。我们选择目前使用率最高的跨平台语言——Java,依托SSH框架(Struts+Spring+Hibernate)开发本系统,使用新的MongoDB+MySQL的数据库架构,在提高海量数据的读写速度的同时兼顾了系统的事务处理能力。该系统依据开源爬虫框架WebCollector开发网络爬虫,并利用Aho-Corasick算法对爬取内容进行预处理,然后使用开源的Word分词组件对舆情信息进行分词处理,采用基于情感词典的方法对舆情信息进行极性情感分析,最终通过应用界面对处理和分析的结果进行展示。互联网的快速发展使得系统的词汇库在系统运行的过程中将变的越来越大,常用的字符串匹配算法无法满足系统正常运行的需求。本文通过对现有的字符串匹配算法进行改进来解决这个问题,提高了匹配的效率,进而满足系统的性能需求。本文所设计的监控系统主要包括舆情信息统计;监控条件的增加删除;舆情具体内容的显示;舆情趋势综合分析等功能。系统界面简洁友好且运行稳定。
其他文献
随着现代教学的发展,高校招生规模不断增大,教师群体数量的不断增多,高校的教学任务愈发繁重,同时教学质量也存在着越来越多的问题,比如监管力度不够,缺乏有效的教学质量评价
宽带蜂窝移动通信技术的飞速发展对蜂窝基站天线的小型化、高性能提出了更高的要求,表现为低轮廓,具备宽阻抗频带、低交叉极化、低反向辐射、具有稳定增益、3d B带宽和对称方
众所周知,笛卡尔哲学开端于对确定性的追求。笛卡尔哲学中提到的确定性有两种,即形而上学确定性(metaphysical certainty)和道德确定性(moral certainty)。但是围绕着道德确
多核化与向量化是高处理器性能的重要手段。并且被广泛应用在CPU与GPU的硬件优化上。多核向量处理器的编程需要依赖于并行编程方法论。本文综合考虑CPU与GPU共有的多核向量特
行人检测是计算机视觉领域中非常重要的研究课题,也是众多视觉任务的基础和前提。其中,分类器和特征是行人检测的两个重要组成部分。AdaBoost分类器与一维特征的结合是一种常
随着大数据时代到来,人们对于数据处理的性能和功耗都提出了更高的要求。近年来发展出的新型非易失性内存(NVM),拥有可持久化的数据、读写速度快、低功耗、按字节寻址等优点,
Android系统开放、自由的特点使其受到了广大用户的青睐。随着其市场占有率的飞速增长,Android系统逐渐引起了黑客的关注,随之出现的Android系统恶意应用,也不断威胁着用户的
本研究利用智学网测评系统进行高中生物“迷思概念(Misconception)”的诊断及转变策略的探究。通过综合分析国内外有关迷思概念的研究现状,以及目前智学网运用于教学的现状,借助实习学校目前所运用的智学网教学服务平台,对高三年级某一次统一理综测试后,利用智学网测评系统具备的校级报告和班级报告功能,开展对生物学科迷思概念诊断的研究。首先对实验班级与其他班级进行整体对照,然后依据智学网对实验班级中5
闪存存储器存储元尺寸和存储密度的发展使得存储容量增加,价格下降,促进了闪存在存储系统中的进一步使用。另一方面,闪存发展带来的问题是可靠性降低,数据更容易出错。因此,
本文利用中国市场数据来研究投资者情绪与股票横截面收益的关系。我们选取每月新发基金规模、每月新开A股账户数、每月新开基金账户数、全市场股数换手率及分红溢价等五个与