面向金融新闻文本的事件识别与抽取

来源 :东南大学 | 被引量 : 2次 | 上传用户:toforworld
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取,自然语言处理领域的一项研究热点,旨在从非结构化的文本中提取用户感兴趣的信息,并以结构化形式保存。事件抽取是信息抽取的一项重要研究内容,面向金融领域的事件抽取主要研究如何从非结构化的金融新闻文本中抽取用户感兴趣的热点金融事件,并以结构化的形式呈现。传统的事件抽取任务针对每一种事件类型预先确定事件模板以及一定数量的标注语料,只能抽取指定类型的事件。而金融领域关注的事件类型较为广泛,从政治到体育,甚至自然灾害,因此,无法事先确定具体事件类型,这对传统的事件抽取方法提出了挑战。为此本文面向金融新闻文本,将事件抽取分解成基于文本聚类的事件识别和基于事件聚类簇的事件抽取,提出一种无监督事件识别与抽取框架,实现准确,开放的金融事件抽取。本文的主要工作包括:(1)为了发现并识别热点金融事件,我们提出了一种基于文本聚类的事件识别算法。该算法设计了一种文本特征提取方法能够从新闻文本中提取事件层面的信息从而实现事件粒度的聚类。为了验证事件识别算法的有效性,我们构建了标注数据集。实验结果表明,我们提出的事件识别算法能够达到92%的准确率。(2)在热点金融事件识别的基础上,我们提出一种基于概率模型的事件抽取算法。算法主要利用句子级别的通用语义分析技术以及聚类文本的丰富冗余性实现无监督的事件抽取。实验结果表明,我们提出的事件抽取方法能够达到73%的准确率。(3)基于前面提出的事件识别与抽取算法,我们设计并实现了一个面向金融新闻文本的热点事件抽取系统,用于实时获取热点金融事件的结构化信息。总体来说,本文面向金融新闻文本,提出了一种无监督的热点事件识别与抽取算法。并在此算法基础上,设计并实现了一个热点金融事件抽取系统,用于实时发现热点金融事件并得到事件的结构化表示。
其他文献
针对宁波市某场地大面积软弱土层的工程特性,提出采用超载真空预压+冲击振动碾压联合法进行地基处理,该方法是将真空预压与表层膜上堆料超载预压以及预压后表层冲击振动碾压相
某机械厂为了实现企业的业务流程规范化,信息流转自动化,管理过程信息化,知识资源共享化,有效提高企业的信息化水平而开发了某机械厂生产信息管理系统。该系统是一个典型的计
经腹筋膜内子宫切除术(intrafascial hysterectomy)是相对于通常经腹筋膜外子宫切除而言,是指在筋膜内进行手术。传统的筋膜内子宫切除术是紧贴宫颈环切至阴道穹隆,切除子宫;而改
上海世博会台北企业馆外饰面采用渐变双曲面再生木墙面。通过对其施工技术的剖析,为今后复杂造型工程的施工技术积累、新材料应用提供借鉴。
父亲走了,犁杖的寂寞无人能懂。
目的:非酒精性脂肪性肝病(NAFLD)是世界上最常见的慢性肝病,是代谢综合征(Me tS)在肝脏的体现。NAFLD是指在机体没有过量摄入酒精的情况下,5%以上的肝细胞发生脂肪堆积变性的病症。本课题通过油酸钠-棕榈酸钠溶液处理HepG2建立脂肪堆积的细胞模型,研究槲皮素、芹菜素、木犀草素、白杨素、牡荆素对脂肪堆积HePG2细胞的脂质代谢的调节作用,并初步探索其可能的作用机制。方法:1.采用CCK-8
随着城市建设程的不断开发,闹市中心插针式的建筑布局将会在很长一段时间内存在。如何在紧邻无桩浅基础砖混结构情况下进行深基坑施工便成了工程中的难题。为此,结合上海番禺路
上海临床医学研究中心工程项目邻近地铁、住宅,周边环境复杂,对施工中的变形控制提出了很高的要求。由此,通过合理的清障施工,采用拔桩、避桩及调整施工工序清障等方法来减少对周
经由中国建筑业协会、建筑时报、首都建设报、广东建设报、天山建设报、西部建设报、甘肃建设报、陕西建筑报、《建筑》杂志、《建筑经济》杂志、《工程质量》杂志、筑龙网(ww
年过五旬的郑雪梅老师内心对钢琴的激情,行动上对钢琴艺术执著的追求,足以感动每一个与她有所接触的人。住钢琴面前,她就像一个纯真的孩子对着一件十足吸引的玩具,专心着迷地琢磨