基于复杂网络词节点移除的关键词抽取方法*

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:sunleilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的] 将词节点移除融入TextRank算法,提升中文文本关键词抽取效果。[方法] 本文提出中文关键词抽取改进算法RemoveRank。通过引入词节点移除的方式,交替进行排序步骤与移除步骤,综合考虑了词图的复杂网络结构特性,将移除队列作为词节点排序结果,实现关键词的抽取。[结果] 利用南方周末带关键词标注数据集进行了实验评估,实验结果表明,引入词节点移除的方式优于传统算法,在关键词抽取数量分别取3,5,7时,其 F值相比TextRank方法分别提高4%,6%,5%。[局限] 构建词图时只考虑词节点是否连通,尚未考虑词节点连边的权重。[结论] 在合适的滑动窗口取值下, RemoveRank算法可以有效的完成关键词的抽取工作。
其他文献
<正>南京的广播市场一向竞争激烈。相关收听数据显示,南京地区广播收听率集中度很低,在南京的上空飘荡着二十几套频率,大多实力相当。频率多,节目类型丰富,听众选择范围广,节
针对川西地区压裂返排液COD含量高达7 968 mg/L而难于达标处理排放的难题,开展了压裂液体系COD值影响因素分析,明确了稠化剂浓度是返排液COD值高低的决定因素。通过进行稠化
为了研究不同剂量腹腔注射舒芬太尼对大鼠麻醉及恢复的影响,将60只SD大鼠随机分为5组(S1~S5),分别腹腔注射舒芬太尼50、60、150、250和400μg/kg,记录大鼠的翻正反射消失时间,
运用非线性理论及有限元方法(ANSYS)研究了矩形岛结构的应力和非线性.应力与矩形岛长度之间的关系表明:使用矩形岛结构能使输出应力增大,可以提高灵敏度.应力的非线性随矩形
<正>近日,人社部、财政部联合发布通知,确定今年对退休人员基本养老金平均提高5.5%。这是本届政府连续第四年决策调待,也是第二次对机关企事业单位退休人员基本养老金统一调
在农村税费改革背景下,当前乡镇机构存在的主要问题表现在两个方面:一是机构庞大,人员臃肿;二是职能没有正确定位.乡镇机构改革是我国政府机构改革的基础环节,搞好乡镇机构改
批评话语分析采用语言学的研究方法,通过对话语这一社会实践形式的分析来研究各种社会问题,揭示语言运用中隐含的意识形态。本文对《中国日报》从2009年6月至2014年10月的50
根据工程实际问题抽象简化,研制了平面桁架结构稳定性实验装置。此实验装置结构紧凑、操作方便。应用此装置开设的结构稳定性实验,因约束形式多种,杆件长度可变,从而形成了不
抗战时期的教育问题是中国近现代史研究领域中颇受关注的一个课题,但抗战时期陕甘宁边区的教育作为其中一个重要组成部分却一直未受到足够的重视。本文在大量的原始资料的基础
自2007年亚洲开发银行首次提出包容性增长到胡锦涛主席在2011年博鳌亚洲论坛提出包容性发展,包容性发展理念不断提升并引起了国内外学者的广泛研究。本文从包容性发展的概念、