【摘 要】
:
文档自动摘要可以帮助人们在海量信息中快速高效地获取主要信息。本文以句子作为处理单元,提出一个基于LDA模型的句子主题特征,通过计算文档主题分布与句子主题分布之间的相
【基金项目】
:
浙江省自然科学基金重点项目(Z12F020027),教育部211重点工程项目(201003017)
论文部分内容阅读
文档自动摘要可以帮助人们在海量信息中快速高效地获取主要信息。本文以句子作为处理单元,提出一个基于LDA模型的句子主题特征,通过计算文档主题分布与句子主题分布之间的相似性,结合句子在文档中的位置和标题相似性等基础特征,形成组合特征计算句子权重,最后根据权重排序抽取摘要。实验结果显示,在LDA模型中加入组合特征后,自动摘要的性能得到了提高。
其他文献
随着列车运行速度的提高,对客车车体的隔音、防水和气密的要求更加严格。为满足这些要求所采取的措施之一是广泛采用各种密封材料。 在以前的市郊、快车、特快车、特快卧
A
由于小学生的抽象思维能力还比较低,因此在学习数学的过程中,草稿本是小学生学习数学的重要辅助工具。但是,目前一些小学生在使用草稿本时却存在格式零乱、功能单一的现象。
基于飞轮储能的动态电压恢复器的传统拓扑结构采用辅助整流器给飞轮充电,提高了系统的复杂程度,也增加了成本。为此,提出了两种新型拓扑结构;并联结构和串联结构。并联结构通过引
围绕农业信息服务的海量数据存储与大规模数据计算问题,资源获取的便捷性、安全性、可靠性和低成本问题,结合农业信息服务自身特点,按照云计算平台架构和面向服务的体系结构(
以上海中医药大学图书馆为例,针对图书馆的网络基本情况,详细介绍了VLAN技术及其在高校图书馆网络建设与改造中的应用过程,以及VLAN技术的应用在网络改造中发挥的重要作用。
本文介绍我国科技工作者使用计算机模拟技术以及与数学、物理、天文、电子、制造融合在中国航天事业奠基工作中发挥的作用[1]。这是我国较早成功使用计算机模拟的一个案例;它
机体发生炎症时会释放大量的炎性细胞因子,并伴随药物转运体表达和活性的改变。转运体的表达和活性改变时,会影响药物的吸收、分布、消除,机体内血药浓度、蓄积情况、药物的
文中基于散射点模型解释了一维距离像的形成原理,分析了一维距离像的特点,并进行了仿真实验。同时对仿真结果进行了分析,为雷达目标一维距离像特征提取和识别提供了一定的理
随着我国经济对外开放的不断深入,选择什么样的汇率制度是我国决策者们不能回避的问题。20世纪90年代以来发生在一些新兴市场国家和向市场经济转轨国家的金融危机,导致了有关
为避免油田火筒式加热炉火管表面杂质淤积结垢引发的安全隐患和人工清理对施工人员健康安全带来的危害,研制出一套安装在火筒炉火管外壁的在线旋转除垢装置,可360°无死角旋