【摘 要】
:
粮食是人类的生存之本、生命之源,是人类生存下去的必备条件之一,而我国又是世界上的粮食大国,粮食的安全更是关系着国计民生、民族自立和社会稳定的全局性重大战略问题,因此粮食舆情分析是网络舆情重要研究方向之一。在网络化、信息化飞快发展的大环境下,如何有效的从网络舆情中提取粮食舆情的热点信息,对粮食舆情进行话题识别从而积极引导社会舆论,有效地控制粮食网络舆情,从而为科学决策提供有力的支撑,更好的服务粮食安
论文部分内容阅读
粮食是人类的生存之本、生命之源,是人类生存下去的必备条件之一,而我国又是世界上的粮食大国,粮食的安全更是关系着国计民生、民族自立和社会稳定的全局性重大战略问题,因此粮食舆情分析是网络舆情重要研究方向之一。在网络化、信息化飞快发展的大环境下,如何有效的从网络舆情中提取粮食舆情的热点信息,对粮食舆情进行话题识别从而积极引导社会舆论,有效地控制粮食网络舆情,从而为科学决策提供有力的支撑,更好的服务粮食安全生产,这在国计民生中起着举足轻重的作用。本文从粮食网络舆情的采集和粮食舆情的文本聚类分析两个方面对粮食网络舆情进行了分析与研究,从而为相关国家粮食部门做出有效决策提供科学的依据。主要内容包括舆情信息的爬取采集、抓取策略、网页的净化过滤、文本分词、特征提取、kmeans聚类以及PCA降维前后的数据分析。本文主要工作如下:1、粮食网络舆情信息的采集本文采用基于主题的网络爬虫技术,根据特定主体,抓取主题相关度更高的网页,减少相关度低的网页干扰,同时在合理合法公开的情况下查证IP、查refer、伪装求情头的拼接以及cookie等系列反爬机制,利用网页解析技术如正则表达式、xpath、beautifulsoup来提取有效文本信息。2、粮食舆情信息的处理包括:网页净化、页面解析、内容提取、去噪排重等关键处理技术。3、粮食舆情文本分词技术、停用词的处理、特征选择、特征权重的计算比较各种中文分词技术的优劣,采用jieba库实现对文本的分词;特征提取技术的研究,非监督学习即聚类分析采用文档频率TFIDF权重计算方式提高文本聚类的准确率。4、粮食舆情分析应用研究采用经典的kmeans聚类算法对文本进行聚类分析,利用PCA算法减少了时空复杂度,与此同时进行特征选择与提取,选择重要特征删除其余特征。通过实验数据分析可知,经过PCA降维后,各项指标均达到优化目的。实验结果显示,经过舆情信息的采集、处理、分析后能有效的识别出粮食舆情文本相关话题,聚类模型的评价指数较PCA降维前都有相应的提升。对有效的掌握粮食网络舆情信息热点问题提供了一定的依据,为相关部门作出科学决策提供有效的支撑。
其他文献
国内生产总值(Gross domestic Product,GDP)是一个国家或地区在一定时间内生产的最终产品的总价值.GDP是宏观经济中一个非常重要的指标,是一个国家或地区制定经济发展战略的重要参考依据.本文使用从上海市统计局网站上得到的GDP数据.首先分析上海市GDP的走向,随着时间的推移,GDP呈现出递增趋势.然后使用1980——2016年的GDP数据分别建立二次曲线模型和时间序列分析模型.
人工智能迅速发展并给社会带来重大变革,自动驾驶作为目前最成熟且应用最广的人工智能领域,致害事件却频频发生,自动驾驶交通肇事责任如何划分、自动驾驶汽车能否具有刑事责任主体资格等成为学界热议且急需面对和解决的问题。美国和德国在自动驾驶的立法规制上比较超前。国内相关立法处于空白状态,目前的自动驾驶发展与法律规范存在冲突和不适应,特别是自动驾驶给交通肇事罪带来适用困境,主要原因是犯罪主体产生异变、主观方面
Kv表示一个有v个顶点的完全图.两个完全图Kr和Kc的卡氏积图,记为Kr×Kc,满足任意两个不同的顶点(a1,b1)和(a2,b2)相邻当且仅当a1=a2或者b1=b2.一个完全图Kv的Kr×Kc-填充(或K
本文给出了半群的双极值模糊软理想,半群的双极值模糊软内理想,软半群的软子半群,软(左、右)理想的概念,研究了它们的一些相关性质和等价条件,并讨论了直觉模糊完全正则子半群直积的
1978年,Erdos提出了与Erd6s-Szekeres问题相关的空凸多边形的问题.对于任意的正整数n≥3,是否存在最小正整数H(n),使得处于一般位置的H(n)个点中存在n个点构成空凸n-边形.Bis
80年代初,在美国新墨西哥州Santa Fe研究所(SFI),以三位诺贝尔奖获得者为代表的科学家,致力于发展他们称之为“复杂性科学(Science of complexity)"的一场革命。然而,经过几
低(零)相关区序列偶集可应用于雷达、声纳及码多分址通信系统中,并在现代通信、空间测控、信号处理以及电子对抗等系统的优化设计中扮演着重要的角色。广泛深入的研究低(零)
刻画Hilbert空间上算子的换位,可以使人们更好地了解算子本身的结构.证明一个算子是强不可约算子就是证明该算子的换位弱闭代数不包含任何非平凡的幂等算子,而求一个算子的约
深海立式管道结构(简称“立管”)用于连接海上平台和海床井口,是海床井口向平台输送油气的基本装置,也是深海油气开发系统中最复杂的结构。立管内部在深海油气开发系统运行期间一般有高压的油或气流过,外部则需承受波浪、海流、冰及地震等复杂海洋环境荷载的作用。同时顶部有与之相连的平台,底部与海床相互作用,这使得立管具有服役环境恶劣,受力极为复杂,建设成本巨大等特点。涡激振动(Vortex-induced vi