【摘 要】
:
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA
【机 构】
:
苏州大学计算机科学与技术学院,江苏省计算机信息处理技术重点实验室
【基金项目】
:
国家自然科学基金(60673041,60873150);江苏省高校自然科学重大基础研究项目(08KJA520002)
论文部分内容阅读
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
其他文献
<正> 安徽省阜阳市是于1992年底由原市、县撤并后组建的。新的市委、市政府成立以来,始终把加快村镇建设,当成促进乡镇工业发展,实现农村富余劳动力转移,振兴阜阳经济发展的
信息技术是一门实践性很强,极富创造性,具有明显时代发展性特点的课程。课程环境与其他学科有着显著的区别。因为信息技术课程的这些特点,要求信息技术教师要有极强的课堂掌
联邦园林展与德国当代园林北京林业大学园林学院王向荣一、联邦园林展自1951年起,联邦德国每两年,举办一次大规模的综合性园林展览———联邦园林展(Bundesgartenschau),从1953年开始,展览每隔10年邀请一些国家
<正>"经济适用房"其实不是一个新名词,早在房改之初,就已经存在,不过后来随着商品房市场的跑疯,渐渐被忽略了。后来,房价渐渐脱离了民众的购买力,中低收入群体面临无房可居的
以开发信息交流平台系统为背景,对基于MVC模式的Struts框架、Hibernate的ORM机制和对持久对象持久化的管理以及Spring IOC(控制反转)技术进行了探讨,整合这三种框架:表现层使
<正>胡适在《杜威先生与中国》一文中写道:“自中国与西洋文化接触以来,没有一个外国学者在中国思想界的影响有杜威这样大。”外国也有学者提出杜威的教育思想远播国外,而其
<正>闭塞性细支气管炎(bronchiolitis obliterans,BO)是一种与小气道炎症损伤有关的慢性气流阻塞综合征。临床表现为反复或持续气促、喘息或咳嗽,运动耐受性差,肺内可听到喘
介绍了一种改进的二值图像连通域快速标记方法。该算法首先找出二值图像中每行的像素直线段,接着利用链表来确定它们之间的连通关系,以此来克服同类算法中像素重复标记和标记
阐明了数据挖掘技术是电信行业提高客户的忠诚度,防止客户流失发生的重要手段,介绍了数据挖掘技术应用于电信行业客户流失分析中的方法、步骤及具体实现过程。
<正>"微课"即微型课堂,是指在应用多媒体技术就教学过程中的某个知识点或教学环节进行针对性讲解的一段音频或视频。"微课"所讲授的内容呈点状、分割状或碎片状,讲授也只是针