基于知识图谱的新冠疫情热点事件主题演化分析

来源 :新疆财经大学 | 被引量 : 0次 | 上传用户:qq447105111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,社交网络逐渐成为人们获取和交流信息的重要途径之一,其传播广泛、扩散迅速的特点对人们了解事件动态、有关部门开展舆论引导带来一定的挑战,采取合适的方法对事件主题进行有效演化分析,有助于分析热点事件发展态势,对有效开展舆情引导有重要意义。知识图谱通过可视化技术对舆情主题的结构关系进行描述,可以较为直观地展示主题发展动态和识别主题热点,本文针对新冠疫情热点事件进行知识图谱构建,基于知识图谱对主题演化进行讨论和实证分析。本文的主要工作分为以下三部分:1.建立新冠肺炎疫情热点事件知识图谱。利用人工采集与网络爬虫技术相结合的方式,对热点事件文本数据进行收集,通过Jieba库中文分词、词向量训练和词义标注等步骤,完成原始数据集的清洗,建立了新冠疫情热点事件语料库。采用Bi LSTM-CRF循环神经网络模型进行命名实体识别,对获得的新冠疫情热点事件结构化数据进行知识图谱的构建,利用Neo4j图数据库对热点事件知识图谱进行存储,并进行可视化展示。2.提出了一种基于知识图谱的短文本语义扩展表示方法。将概念知识图谱中与文本特征词之间有较高关联度的概念词进行提取,构成当前短文本特征词的概念词集合。将概念加入特征词集合得到特征词的语义扩展表示,并基于公开已分类数据集进行了扩展前与扩展后的分类实验。结果显示,概念化语义扩展表示可以提高短文本的分类效果,为后续的主题演化关系分析做准备。3.利用热点事件主题演化模型,对新冠疫情热点事件评论数据集进行实证分析。采用基于知识图谱的语义表示方法和基于增量聚类算法的主题发现方法,实证分析了评论数据中主题发现过程。构建热点事件主题演化模型,将余弦相似度和KL散度引入知识图谱,通过计算主题之间的相关性,定义了主题演化关系,并对新冠疫情热点事件进行了主题演化态势分析。
其他文献
在新发展理念之下,我国经济增长由规模和速度型向质量和效益型转变,并急需扭转能源消费和二氧化碳排放量快速增长的局面。2011年,我国陆续开展碳交易机制试点,碳交易机制的实施不仅能倒逼能源结构调整,推进供给侧结构性改革,加快能源清洁化进程,促进产业结构优化,还能有效控制二氧化碳的排放,加强对生态环境的修护与保护,进而实现经济高质量发展,所以碳交易机制与我国经济高质量发展具有内在的一致性。当前,在碳达峰
学位
据国家官方报告显示,钢铁行业的碳排放量一直稳居制造业之首,在全国碳排放量中占比高达15%,因此在“双碳”规划的背景下,钢铁行业的低碳转型尤为重要。然而,低碳转型首要是设备的升级,需要投入大量的资金。但是,在2020年全球疫情的冲击下,钢铁的进出口逆差进一步扩大,导致钢铁行业产能过剩现象严重。本年度钢铁整个行业的利润总额仅为2074亿元,并且整个行业的平均销售利润率仅为4.41%,相比于2019年的
学位
改革开放以来,我国在由计划经济向市场经济的转型中,采取了渐进式的转轨模式。在市场经济体制下,社会经济的有效增长,不仅在于供给的增加,关键在于有效需求的实现。消费作为内需,是经济增长的主要动力。然而我国居民的消费率却逐渐走低,挖掘居民消费潜力,刺激内需,将有效带动我国经济的高质量发展。进一步分析发现,城乡居民的消费水平和消费结构也有很大的差距,城乡消费差距在时间上和空间上均有明显差异。本文的研究内容
学位
化工行业作为“双高”行业的代表,其生产和经营活动对资源和环境造成不可逆转的影响,自然受到政府部门和社会公众的广泛关注。传统高污染行业与当下提出的绿色发展和双碳目标的发展基调出现不一致状态,因此金融机构在审批贷款时需要考虑环境因素在化工企业经营中所带来的影响,以此推进企业尽快符合当前发展趋势。ESG投资理念正是考虑到了企业治理、社会和环境三个维度,因此ESG投资理念对化工企业绿色信贷风险评估具有深刻
学位
新型城镇化指出必须要采取相应的措施走出一条资源节约、环境友好、经济高效、社会和谐、城乡一体化及统筹发展的集约、智慧、低碳、绿色的城镇化道路,坚持绿色发展,实现新型城镇化与生态环境之间的协调发展。随着我国经济的不断发展,绿色发展理念深入人心,如何实现在不断推进新型城镇化的前提下,做好生态环境的保护是我们现在要面临的严重问题。基于该背景,探讨西部地区新型城镇化与生态环境的耦合协调发展水平有着重要意义。
学位
随着各地政府报告中频繁指出建设“消费中心城市”,城市经济形态逐渐由生产型城市向消费型城市转变,人们越来越重视城市作为生活和消费场所的功能。城市消费活力成为评价一个城市是否具有竞争力及发展潜力的重要指标。研究城市消费活力能更好的发掘城市的消费市场潜力,把握城市消费的空间格局,吸引高质量人才的聚集,推动城市经济的总体发展水平,使城市居民更具自豪感和幸福感。本文以西北五省省会城市作为研究对象,结合消费型
学位
针对全国贫困态势由绝对贫困转变为相对贫困的变化情况,本文采用AF双界限法测度新疆农村相对贫困,并利用对数线性模型分析影响农村相对贫困的因素,首先选取经济、教育、医疗和生活环境四个维度11个指标建立相对贫困测度指标体系,计算相对贫困发生率、平均被剥夺指数和多维相对贫困指数,并对多维相对贫困指数进行维度和指标上的分解。然后,将2017年新疆农村多维相对贫困维度数作为被解释变量,建立对数线性模型,对影响
学位
伴随着互联网时代的来临以及社会经济的不断发展,银行等金融机构相继推出在线借贷申请业务,互联网企业也围绕贷方机构匹配等借贷周边服务开发了许多在线应用平台。同时,随着数据挖掘技术的不断发展,机器学习算法凭借自身优势被广泛应用于金融风控领域并取得了优异的成绩,然而,目前已有研究中仍然存在以下问题:问题1:基于逻辑回归等传统机器学习算法的借贷违约预测模型有着较好的可解释性,但预测精度有限。问题2:基于集成
学位
自改革开放40多年来,中国通过各种改革措施和改革政策使得经济地位直线上升,其中最明显的表现就是人民不需要在为了生存而担忧甚至可以通过出门旅游等方式来追求精神的富饶,但是在这背后却隐藏着贫富差距扩大的重大问题,最直接的问题就是城乡居民收入差距较高。城镇化理念的提出衍生出一些相关措施和行动,而这些措施和行动的实行确实使得城乡居民收入差距有所减小,但是由于理解的偏差,很多措施和行动的实行使得当地的经济得
学位
随着我国经济实力不断增强,行政单位体制发生巨大的变化,行政单位需要不断发挥自身服务人民,统筹管理的职能。基于此,建设行政单位内部控制体系不仅可以提升行政单位运行效率,节省人力资源,还可以减少违法违规行为的发生。十八届四中全会,党中央对行政单位内控建设就提出:对权力集中的部门和岗位要强化内部流程控制。可以看出内部控制建设能够守住风险底线,是加快实现高质量发展的有力举措,对增强行政单位资源利用效率、提
学位