基于潜在语义分析的文本摘要技术研究

被引量 : 0次 | 上传用户:renminjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网Web2.0时代的到来,使得网上的信息呈爆炸式增长,丰富的资源给人们的生活带来了极大的便利,但同时也带来了巨大的挑战。移动互联网的发展使我们可以随时随地获取所需信息,而移动设备由于自身的技术限制,狭小的屏幕无法显示尽量多的内容。因此,面向用户的自动文本摘要将是当前互联网发展的一个不可或缺的服务。潜在语义分析是一种代数模型,它借助矩阵的奇异值分解,把原始文本空间中的词汇和句子投影在代表潜概念的维度上,从而能够揭示文章的主题,捕捉到隐藏在词汇背后的语义。本文研究了利用潜在语义分析进行文本摘要的技术,主要工作如下:(1)我们首先给出了一个基于主题模型的文本摘要算法框架,在总结了传统的、当前成熟的词项权重计算方法的基础上,提出了邻居权重的概念,定义了新的权重计算公式。实验证明新的权重模型能够更好的揭示潜在语义空间。(2)在LSA所得到的潜在语义空间中,主题和句子的重要程度完全依赖于奇异值分解得到的对应奇异值的大小,我们不仅考虑了潜概念与句子的对应关系,更结合了潜概念与关键词的关系,提出了一种综合考虑关键句描述和关键词描述的主题描述方法。(3)本文在DUC2002和DUC2004数据集上,对比了以往各种基于LSA的摘要方法以及当前主流的方法,以ROUGE分数为评测指标,逐一作了验证,实验表明利用新的权重模型和本文所提出的综合性的摘要算法,能够得到更好的效果。
其他文献
由于电子技术、通信技术、传感器技术、自动控制技术在汽车中的广泛应用,汽车电子的规模不断扩大,功能日益增强,进而对车内通信网络总线的要求不断提高。以太网技术以其统一
随着网络信息技术的发展与进步,人们获取信息的方式方法变得更加多样,传统信息传播方式已经不能满足人们的需求,社会进入了新媒体时代。在这样的时代背景下,传统媒体尤其是电视新
随着互联网、大数据、云技术的不断发展,信息技术的链式效应和乘数效应逐渐显现,企业会计信息系统亟待完善。本文通过对当前会计信息化建设中存在的问题进行分析,提出了未来
随着新的发展时期的到来,在党中央、国务院的领导之下,我国的经济实现了跨越式的发展,国民生活水平逐步高升,创造了中国经济腾飞的奇迹。国家的创新能力不断增加、科技应用能
目前中国生产型企业正面临着原材料价格上涨,人工上涨,技术更新加快,垄断供应商及供应商开发困难等严峻形势。所以,迫切需要在成本控制上有所突破和发展。本论文在介绍了传统采购
在经济全球化的大环境下,随着改革开放和中国的入世,越来越多的中国企业开始从事国际贸易。但是,很多中国企业的企业简介质量不过关,不但不能吸引海外客户和投资者,反而影响
为实现高校的国际化、开放式办学战略,黑龙江省高校也纷纷设立了英文网页。网页中的“学校概况”在介绍高校信息、展示高校形象、促进学术交流和合作等方面起着至关重要的作用
目的:1、利用进食困难指数和日常生活口腔影响指数量表对固定义齿进行咀嚼效率及生活质量的主观评价,通过实验室方法对咀嚼效率进行测定来客观评价修复体咀嚼功能。通过主观和
甘肃华羚实业集团总部设在甘南藏族自治州首府合作市,是一家集酪蛋白产销、进出口贸易、水电、生态旅游、生物科技领域、实业技术开发、城市建设、清真食品生产为一体化的现