基于图挖掘的文本主题识别方法研究综述

来源 :中国图书馆学报 | 被引量 : 0次 | 上传用户:fh2029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。
其他文献
目的:探讨光学相干断层扫描(OCT)血管成像技术对原发性慢性闭角型青光眼诊断的价值。方法:观察25例(50眼)原发性慢性闭角型青光眼患者视盘血流情况。以分光谱振幅去相关OCT血
目的研究双磷酸盐类药物帕米磷酸钠对成骨不全患者原代成骨细胞和成纤维细胞增殖分化的影响。方法实验组:成骨不全患者成骨细胞及成纤维细胞;对照组:先天性髋脱位成骨细胞及
背景与目的:大肠癌是发生在消化道的世界范围内的常见恶性肿瘤之一,发病率及死亡率分别位列恶性肿瘤的第二位和第五位,严重威胁着人类健康。大肠息肉尤其是腺瘤性息肉是大肠
会计舞弊事件发生概率越来越高,为提高会计信息质量,保证会计信息真实性、可靠性和安全性,上市公司纷纷设立审计委员会。然而,对于审计委员会实际作用的发挥,我国学者持保留
风险态度作为一种稳定的个体特质,影响着人们风险决策中偏好反转行为的发生,而时间压力也会影响个体的决策。因此本研究在原有研究基础上扩大了时间压力的水平,同时引入风险
行政垄断是阻碍我国市场经济发展的主要障碍 ,反垄断法应将其作为规制对象。针对其成因、特性 ,在反垄断法中必须构建一套行之有效的制止行政垄断的新制度。
运用电子克隆的方法获得一个燕麦BTF3基因的完整的cDNA序列。利用生物信息学方法对其编码的蛋白的一、二、三级结构和功能进行预测和分析。结果表明:该基因cDNA全长为870 bp,
“概念获得模式”旨在通过呈现范例,运用归纳的方法,比较概念及非概念的区别与联系,帮助学生获得某一概念以及了解概念形成的过程,从而更有效地掌握概念。在化学教学中,“概念获得
电动汽车充电桩的接入会给配电网乃至整个电力系统带来诸如电压偏移与闪变、三相负荷不平衡、谐波等问题,在这些电能质量问题中以谐波干扰较为严重,会直接影响配电网的安全稳
向量是抽象代数、线性代数、泛函分析中的基本数学模型。同时也是重要的物理模型。在向量内容的教学中,应关注以下两点:第一,根据学生的生活经验,创设丰富的情境。第二。注重向量