社交网络的事件要素提取方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:VANDY115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,人们对互联网的依赖性日益增强,越来越多的人在社交网络上发表自己的看法或者记录自己的生活,所以基于社交网络的分析研究日趋活跃。基于社交网络的事件检测能够在第一时间发现现实生活中发生的事件,有利于增强突发预警、舆情监控等方面能力。事件要素提取通过对事件文本进行分析,提取事件相关的人物、地点、时间等信息,便于人们更加直观的了解事件,掌握事件中的核心信息。现有的事件要素提取可分为模式匹配和统计学习两类方法,其中模式匹配的方法通过制定规则对文本内容进行匹配,通常只适用于特定领域,且规则制定成本较高,因此在实际中难以大规模应用;统计学习方法通过识别事件文本中的命名实体来提取事件中的人名、地名、时间等信息,但现有命名实体识别方法普遍存在识别种类过多导致准确率不高的问题,且对高噪声环境的社交网络短文本识别效果不理想,因此也很难获得准确的事件要素信息。本文对社交网络中的事件要素提取方法进行研究,重点考虑时间要素与地理位置要素提取,主要贡献与创新有以下两个方面:(1)提出基于模型约束的时间要素提取方法。该方法克服了传统命名实体识别方法提取特征没有针对性的问题,根据社交网络中时间要素的特点增加了特征集合,同时在运用条件随机场模型进行识别的过程中,针对学习速度过慢以及边界识别问题不准确等问题,构建了有约束的条件随机场模型,经过实验数据测试,本方法能够提高识别时间要素的准确率,从而提高了模型的综合表现。(2)提出基于文本句法特征的事件地理位置要素提取方法。该方法首先构建了地名实体与事件地理位置要素的一致性模型,从事件的推文集合中提取了候选集合;其次在提取过程中,为解决样本不均衡问题,通过对样本进行加权的方法提高了识别准确性;最后,本文以一致性概率为权重,在候选集中提取地点作为事件地理位置要素,再将提取的地名实体映射为GPS进行可视化对比,论证了方法的准确性。
其他文献
近年来随着我国经济的发展,经济体制改革不断的深入,民营经济的作用越来越重要。越来越多的创始股东选择通过上市来解决企业发展中的一些资金问题。上市企业的股份可以自由的流通,部分投资者通过买卖股份对创始股东控制权形成冲击。近年来创始股东的控制权争夺事件屡见不鲜,如“万宝之争”、国美控制权争夺事件等。控制权的争夺有两方面的影响。一方面,控制权争夺事件能给创始股东敲响警钟,增强其危机感,鞭策创始股东更努力的
目的:全面了解外部门太湖蓝藻和环境条件的观测技术及太湖蓝藻生长发育和暴发与环境条件的关系。方法:通过江苏省气象部门技术人员和南京地理与湖泊研究所技术人员的一同入湖