基于元路径选择和融合的异构信息网络社区挖掘算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:catx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络分析(SNA)是数据挖掘研究领域的一个热点,受到越来越多研究学者的关注,而社区挖掘是社会网络分析的一个主要研究方向。当前大部分的社区挖掘算法都假定网络中仅存在一种对象类型和关系类型,这种单一关系的网络结构并不能有效解决现实问题,因此异构信息网络应运而生。它是一种复杂的抽象网络结构,通常包含多种对象类型和关系类型,而且还可能带有多种属性信息。在这种类型的网络上进行社区挖掘能够充分利用网络中存在的多种关系,使挖掘结果更加满足用户的需求,对网络信息的获取和挖掘、信息的推荐以及网络模式的演化预测具有重要的研究价值。本文将主要从元路径的选择和融合方面进行异构信息网络社区挖掘算法的研究。具体研究内容包括以下方面:首先,提出了一种基于用户指导的元路径选择方法。该方法基于用户的指导信息,根据元路径划分社区的方式,利用元路径所表示的相似度向量之间的余弦相似性,在异构信息网络的网络模式上采用启发式搜索和剪枝策略选择出与用户指导信息所隐藏结果相一致的元路径。避免了基于长度限制的BFS(宽度优先搜索)遍历算法的元路径选择所带来的信息丢失和矛盾问题。其次,提出了基于关系抽取的元路径的多种加权融合策略。通过对同构信息网络中几个典型的社区挖掘算法的研究,根据其共同特点,将其建模为一个统一的框架。并根据这一框架结构,将同构信息网络中的社区挖掘算法进行扩展,对异构信息网络中所提取的多条元路径和利用关系抽取方法计算出的权重信息进行各个阶段的融合,提高了社区挖掘的准确性。最后,进行了实验的设计与实现,并在真实数据集上与传统的社区挖掘算法进行了比较,证明了基于元路径选择和融合的异构信息网络社区挖掘算法的有效性。
其他文献
形式概念分析自1982年由德国的Wille教授提出以后,近年来被广泛用于软件工程、知识发现、信息检索等领域。概念格是形式概念分析中的核心数据结构,通过Hasse图来表现出概念之
Internet的开放性使其得到了广泛的应用,但同时也带来了很多问题,每一个终端都有可能成为被攻击者,由此引起的DDOS攻击广泛的存在于Internet中,其本质是向受害主机发送大量的数据
随着通信技术的迅速发展,网络以及通信协议日益复杂。实际的网络是由多个网络设备组建而成的。作为网络的核心,路由设备和运行在其上的路由协议实现的正确性对网络性能起着举足
随着软件规模变得越来越大,自动化测试的效率也越来越重要。在软件测试领域,有大量的测试用例需要执行,每条用例对应的执行代码的逻辑结构可能不尽相同,如果每条用例的代码都手动
云计算技术已经成为了计算机技术中最引人注目的话题。根据调查显示云计算产业年增长率超过26%。然而伴随着云计算中心的规模不断扩大,现今云计算中心自身的问题也逐渐凸显出
选播是一种新的网络服务体系,它可以有效解决网络流量分布不均而导致的网络拥塞,较好的分摊网络负载,使网络资源得到合理利用。选播虽然在均衡网络负载方面有其特有的优势,但是它
传统能源日益枯竭,利用新能源的技术又不成熟;人们的环保意识日益增强,节能是环保的一个方面;我国的企业在同等产值上的能耗远远高于世界平均水平。在这样的背景下,研究节能技术显
电动机的调速是随着电力电子技术及微处理控制技术的发展而发展起来的。电力半导体器件及电子电容器件是电力电子技术的集中体现。在电机的PWM变频调速、矢量控制变频调速。
授权代理是访问控制模型十分重要的组成部分,本文在深入研究几种现有权限委托代理模型的基础上,利用RBAC自身管理RBAC的思想,在PBDM模型的基础上提出了一种新的具有自我管理
随着网络教学资源的急剧增加,传统基于关键字的教学资源检索由于缺少在语义层面上的处理和表示,这就造成了检索结果的不全面和不准确性等问题,不能满足用户对于网络资源检索的需