基于概念格的知识获取及其应用研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:leijugui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析是一种有效的知识表示与知识处理工具,已被广泛的应用于信息检索、机器学习、人工智能和软件工程等领域。然而,随着数据库和网络技术的发展与应用,数据库的规模不断增长,数据库中包含的信息量也在急剧膨胀。在包含有价值信息的同时,这些数据库中也存在着大量的冗余信息,因而研究如何从这些数据库中高效地提取有用的知识就具有重要的意义。 为了提高基于概念格的知识表示与获取效率,推动概念格更广泛的应用,论文对形式概念分析理论进行了深入研究,主要工作包括:(1)在概念格的属性约简方面,研究分布式环境下概念格的属性约简方法;(2)在伪内涵问题方面,研究计算伪内涵的高效算法;(3)研究概念相似性度量和概念近似技术;给出基于相似性度量和概念分析的模块识别方法,以寻求高效的支持遗留软件系统重构技术。 论文的主要研究成果体现在以下几个方面: ·从概念格Hasse图和形式背景的角度,刻画形式背景中不同类型属性的特征;通过分析核心属性和绝对不必要属性的局部特征与全局特征间的关系,提出一种计算分布式环境下概念格的属性约简方法。其基本思想是利用独立计算出的局部形式背景的约简,通过合并计算得到全局形式背景的约简。 ·从概念内涵最小生成子的角度,刻画伪内涵的特征,提出一种基于概念内涵最小生成子的伪内涵算法。该算法的特点是只需对概念内涵的非闭集最小生成子进行计算,便可得到形式背景所有的伪内涵。对算法的性能进行分析,并给出一些优化策略。与现有算法相比,该算法有效缩减了伪内涵的搜索空间规模,提高了伪内涵的计算效率。 ·给出形式背景中基于互信息的属性重要度,并定义形式概念间的相似性度量;在此基础上,给出一种基于相似性度量的概念近似方法。对任意给定的对象集、属性集或对象集与属性集序偶,返回概念格中与之最佳相似的上近似概念和下近似概念。该方法充分考虑了属性的重要度和概念格的结构特征,有助于获得更好的概念近似结果。 ·提出一种基于相似性度量和形式概念分析的模块识别方法。在概念分析过程中,通过引入概念抽象、哑概念和相似性度茸等新的特性,有效解决概念重叠对候选模块质量的影响,提高了模块抽取的自动化程度和重构后的软件系统质量。
其他文献
TAC竞赛是专为交易性Agent之间的竞争而创造的平台,Agent通过游戏服务器提供的市场进行交易并且实现竞争目标。竞赛的目的不仅仅是为了人工智能技术的运用,更主要的是要将人工
随着信息化的发展和深入,许多企业投入大量的资金在企业信息化的发展和改革中。企业的信息化系统在生产和工作中也为企业带来了极大的便利和较高的效率。但是随着各种信息系
在高可用计算机的研究当中,如何保证系统的可用性和应用可靠性一直是需要首先考虑的问题。机群以其高性价比和高扩展性成为构造高性能计算机的一种主要方法,而节点间松散耦合
随着信息技术的广泛发展,中小企业对电子商务系统的需求越来越大,可是电子商务系统的开发效率和规范性并不能满足企业用户的需求。由于技术是以市场为导向的,所以本课题主要
化学和生物领域公开数据的快速增长,为人们在药物研发领域对于大数据的挖掘提供了更多的机会。这些数据集无论在规模,还是复杂度方面都在不断增大,这使得对这些数据的表示和
Web数据库是数据库应用领域一个非常重要的应用分支,它的安全性研究是数据库理论研究的重要方向。身份验证是数据库系统的钥匙,用户只有通过身份验证才拥有合法权力继而对数
在未来的融合网络环境下,为了提供以用户为中心的智能化电信业务,需要动态地查找、组合和调用各种分布的、异构的网络提供的服务,从而构建一个开放、统一的电信业务计算环境
如今,对等网络占用了超过60%的因特网带宽。它们使用户使用因特网的习惯发生了翻天覆地的变化。与此同时,它们还对音乐、唱片行业的销量造成了极大的影响。为了减少经济损失,
随着3G时代的来临,更加丰富多样的3G业务将带给人们越来越多的方便。3G业务运营的复杂性,将给电信运营商的业务支撑体系带来巨大的挑战。业务支撑体系的核心就是计费系统。因
随着计算机和网络技术的广泛应用,工作流己经成为协调企业业务过程、增强企业应变能力和竞争力的重要技术。工作流技术的研究正日益受到人们的重视。然而,相对于工作流技术而