论文部分内容阅读
情报研究工作中目前有很多方法和工具进行知识结构演化的科学情报分析,但它们主要局限在静态关联强度阈值层聚类结构和静态时间窗聚类结构的分析上,主要描述知识结构的宏观状态,虽然也能借助多个静态宏观结构(例如不同阈值层的聚类结构)人工比较分析,但难以自动对不同聚类结构的差异、性质及相应的演变倾向进行探测,因此还难以有效支持对知识结构演化的深层次自动分析以及对潜在演变趋势的探测。
针对这个问题,对发现潜在知识、发现新知识、监测知识突变、分析知识转移、识别重要节点、展示演化结构等方面的研究进行了分析,指出现有的研究对潜在的,萌芽的,有强烈演化可能的知识的自动探测存在严重不足。
在共引聚类生成知识结构的基础上,提出不同阈值层聚类结构间差异性自动检测分析、自动发现宏观结构下的潜在结构的方法,提出不同时间窗聚类结构主题簇传承关系自动检测分析、自动发现不同时间聚类结构的演变趋势,并通过一个以这两种检测机制为核心模块的知识结构演化分析试验系统,对这两种方法进行初步验证。不同阈值层聚类结构间差异性自动检测方法称为阈值层潜在结构检测策略(简称阈值策略),不同时间窗聚类结构间主题簇传承关系自动检测分析方法称为时间窗演变结构检测策略(简称时间策略)。阈值策略的目标是寻找潜藏在宏观聚类结构下的孕育中、发展中的对象和关系,时间策略的目标是寻找在时间流中聚类结构包含的演变关系和演变过程。
阈值策略着重分析不同阈值层聚类结构中聚类簇的相互关系,定义同一阈值层中簇与簇的relative关系和不同阈值层之间的twin关系,划分并定义5个种类的潜在簇。进一步,设计阈值策略实施的步骤,包括突变阈值区间的确定、两个阈值层relative关系和twin关系的构建、5种潜在簇的寻找、潜在关系的确定,最后是潜在结构的可视化展示。
时间策略着重分析不同时间窗聚类结构中聚类簇的相互关系,构建时间窗间簇与簇的ancestor关系和offspring关系,分析时间窗间的“遗传继承”性。利用ancestor关系和offspring关系,划分并定义6种演变簇。设计时间策略实施的步骤,包括时间窗间ancestor关系和offspring关系的构建、6种演变簇的寻找、演变关系的确定,最后是潜在结构的可视化展示。
通过系统分析与建模,实现试验系统,初步证实两种策略的有效性。