用于网络舆情分析的深度学习自然语言处理研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:vvchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,网络社交信息爆炸式增长的同时也带来了网络舆情分析的问题。传统的网络舆情分析模式采用的是词库的方式,语料直接与词库进行比对后进行判断。这种方式由于中文的复杂性,例如存在近音词、同义词、缩略词、暗语等非规范中文表达,使得舆情分析的效果不佳。结合深度学习来对语料进行处理,可以有效的提高对非规范中文表达进行分析时结果的准确性。
  本文根据这一方法,深入研究基于深度学习的自然语言处理,以求在分析自然语言的词相似性中得到更准确的结果,并结合这一方法开发用于网络舆情分析的深度学习自然语言处理系统,本文研究内容主要包括以下部分。
  基于python的Scrapy网络爬虫研究。本系统将使用网络爬虫获取网络实时语料数据保证数据库的时效性,通过这种方式可以有效的提高自然语言处理对非规范性语言的覆盖程度,提高分析的效果;
  搭建语料数据库服务器。本文在处理数据的过程中需要不断地更新现有的语料库,所以需要搭建语料数据库用于存储实时的语料数据,并在数据库中完成对语料数据的初步处理,通过正则表达式和分词得到可以用于深度学习的数据;
  基于TensorFlow的自然语言处理深度学习算法设计与实现。本文采用了一种动态权重多模型相融合的词相似性分析方法,根据语料的特点选取不同的语料库,并结合多种模型进行计算,提高词相似性分析的准确性,使得自然语言处理所得到的结果对网络舆情分析有更好的支持度,本文通过实验发现多模型相融合的方法得到的结果比单一模型更好,在使用NLPCC-ICCPOL2016中文词语相似度比赛中PKU-500数据集作为评价的参考标准时,本文所采用动态权重多模型融合的词相似性分析法,获得0.568的斯皮尔曼等级相关系数,与该比赛第一名的结果相比提高了9.6%,因此多模型相融合的方法可以提高计算词相似性时的准确率;
  整合以上各部分构建网络舆情分析系统。搭建出的网络舆情分析系统将实现自动实时收集网络语料并加入语料库进行深度学习计算,不断更新计算结果,提高网络舆情分析系统的时效性,同时提供词相似性查询功能,使用者可以通过该系统直接得到两词相似性的量化结果。
其他文献
【中图分类号】 G62.23【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  英语小组合作学习其实是一种学生互补的教学策略。也是英语教师在进行教学活动的重要组成部分,英语小组合作学习打破了教师一言堂的局面,使学生的主动性、创造性得到了充分的发挥。它在改善课堂教学,大面积提高学生成绩,促进学生形成良好的学习习惯等方面实效显著。  我校于2008年全校所有班级和所有学科推
期刊
【摘 要】 物理学是一门以实验为基础的学科,许多物理知识都是通过实验探究总结出来的。因此物理教学过程中应该重视学生實验探究能力的培养。学生通过观察丰富多彩的物理现象,积极探索物理奥秘,启迪智慧和培养创造能力,形成稳定的学习动机。  【关键词】 初中物理;实验探究;能力;培养  【中图分类号】 G63.32【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  物理课程标准把
期刊
【中图分类号】 G62.24【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  《数学课程标准》(2011年版)指出:“义务教育阶段的数学课程是培养公民素质的基础课程,具有基础性、普及性和发展性。数学课程能使学生掌握必备的基础知识和基础技能,培养学生的抽象思维和推理能力,培养学生的创新意识和实践能力,促进学生在情感、态度与价值观等方面的发展”。练习课是学生掌握基础知识和
期刊
【摘 要】 语文课程的终极目的是让学生理解和运用祖国的语言文字。语言文字的理解和运用自然离不开语言文字本身。当老师舍弃了语言文字本身,过多的去关注教材所体现的内容,这无疑是舍本逐末。教法必须要服务于教材,回归语言文字本身,关注语言形式,必定依赖于文本细读。这就要求教师对于文本、对于教材、对于语言文字,有高度的敏锐感,有较强的语文意识。笔者从几个课例入手,阐述如何对文本进行慢慢读。  【关键词】 课
期刊
【摘 要】 《小学英语课程教学基本要求》中明确提出:当今世界,以信息技术为主要标志的科技进步日新月异,英语日益成为我国对外开放和国际交往的重要工具。《英语课程标准》中明确提出:小学生应学习话题范围内的600—700个单词。新一轮的课程改革也指出,在新教材和新课标的要求下,小学英语教学中单词的识记直接影响着孩子们学习的兴趣和课堂学习的效率。所以,更应该在课堂教学中引导孩子们掌握一定的单词识记策略。 
期刊
【中图分类号】 G63.32【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  一提起写作,很多学生就会头疼,就会抱怨,就会抓耳挠腮,无从下笔。写作是初中孩子学习中的“软肋”,如何帮助他们尽快的爱上作文,能在规定时间内愉快地完成写作,是我在教学中重点抓的工作。在学校营造的“导引——生成”教学模式的大环境下,我做了如下工作。  一、找寻症结  通过问卷调查和批阅作文,我发
期刊
【摘 要】 本文对小学语文朗读教学中存在的问题进行分析,并且详细地叙述朗读教学在小学语文整体教学中的影响和作用,针对现存的问题提出了一系列的改进建议。  【关键词】 小学语文;课堂朗读;口语训练;分析  【中图分类号】 G62.23【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  在小学语文的整体教学过程中,除了基础内容之外,朗读教学也是其中重要的一部分,朗读教学不仅
期刊
【摘 要】 新课标中提出了,要让学生成为学习的主人,使学生成为自觉的求知者。未来学家认为“未来的文盲将不是那些不识字的人,而是没有学会‘怎样学习’的人”。因此,在教学过程中教师应该帮助学生自主学习。  【关键词】 低年级;语文;自主学习  【中图分类号】 G62.24【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  课改语文新教材的特点之一是学习量大。如果按以往满堂灌
期刊
【摘 要】 现代社会提倡终身阅读,以提高个人素养。那么,从小喜欢阅读,培养阅读能力,便尤其重要了。小学语文学科中,阅读教学是很重要的一部分。如何在小学语文教学中提高小学生阅读能力?这是一个积累的过程,也是一个快乐的阅读过程。下面结合教学,谈一谈小学语文阅读教学中的几点体会与浅见。  【关键词】 兴趣;阅读能力;朗读训练;合作探究  【中图分类号】 G62.3【文献标识码】 A【文章编号】 2095
期刊
【摘 要】 《小学汉语课程标准》指出,阅读教学应“逐步培养学生探究性阅读和创造性阅读的能力”。叶圣陶先生说:“学语文要靠学生自己读书,自己领悟。”小学高年级是提高学生汉语素养的一个重要阶段。  【关键词】 阅读;氛围;方法;评价;引导;拓展  【中图分类号】 G623.2【文献标识码】 A【文章编号】 2095-3089(2016)36-0-01  作为一名小学汉语教师,加强对学生汉语阅读能力的培
期刊