【摘 要】
:
数据挖掘是一种将原有的数据分析法与处理大规模数据的复杂算法相结合的技术。链接挖掘作为数据挖掘的一个分支,它的研究任务包括描述和预测模型,随着链接概念的提出,链接预
论文部分内容阅读
数据挖掘是一种将原有的数据分析法与处理大规模数据的复杂算法相结合的技术。链接挖掘作为数据挖掘的一个分支,它的研究任务包括描述和预测模型,随着链接概念的提出,链接预测已经成为近年来的研究热点。目前,现有的链接预测方法一方面仅利用一种特征(结构或属性特征)进行链接预测,忽视了时间因素和特征的重要性;另一方面,不能针对给定的合著网络系统地抽取拓扑特征和语义特征,预测能力比较低。本文针对这些问题展开了研究。首先,为兼顾社会网络所提供的属性信息、结构信息及网络的动态特性,本文采用矩阵法对网络的各种信息进行分析,并给出社会网络及其信息的表示形式。其次,提出一个以矩阵的方式来组合时间特征、加权属性特征和加权拓扑特征的链接预测方法。该方法利用社会网络中的一种对齐关系来识别出重要的特征,并以矩阵的方式将这些特征有效地组合起来,从而提高链接预测的性能。另外,采用奇异值分解技术来减小存储空间。再次,针对合著关系网络,首先给出合著网络中链接预测问题的定义,接着为捕获网络中多方面的有效信息,从给定网络中系统地、有步骤地提取拓扑特征、语义特征以及时间特征,再利用有监督学习框架组合这三种特征,并提出一个同时使用三种特征的链接预测模型,从而进一步提高链接预测的预测性能。最后,通过实验对所提出算法的可行性和有效性进行验证,实现了预期的研究目标。
其他文献
随着互联网的蓬勃发展,网上信息资源呈几何级数的速度增长。搜索引擎的出现帮助广大网民迅速定位到自己想要的信息,节省了用户在漫无边际的网络中查找信息的时间,但是单个搜
生物信息学是一门综合运用数学、计算机科学各种工具和方法,来阐明和理解生命科学领域大量数据所包含的生物学意义的学科。中国科学院微生物研究所网络信息中心多年来一直开展
信息是这个时代的主题,数字化的信息以其存储和处理等优势,越来越受到人们的青睐,数字图像在日常生活中更是随处可见。随着数码相机、扫描仪等设备越来越先进和廉价,以及其相关的
目前,多Agent系统中的信任模型研究主要包括基于证据(即主观信任)及基于凭证(即客观信任)两个方面。基于证据的信任模型充分考虑了信任的主观性、不确定性和动态性。它是对交
本文源自国家高技术研究发展计划(863计划)专题课题(NO:2007AA12Z156,高空间分辨率影像目标自动识别)。
随着遥感平台及计算机技术的迅猛发展,高分辨率遥感影像的应用领
随着铁路建设的不断发展,铁路轨道安全问题越来越被人们重视,对铁路轨道数据的采集分析也越来越重要。本课题以铁路轨道数据采集系统的研制为主要内容,基于USB与多线程两种关
Web服务为多个自治域之间的分布式工作提供了通用平台。基于Web服务的分布式环境由于集成多应用环境工作方式对于Web服务的分配以及访问控制的安全,尤其是授权访问有特殊的需
近年来,随着以计算机科学技术和通讯技术为代表的信息科学技术的广泛而深入的应用,人类社会已经进入了“网络时代”,网络互连和资源共享在方便了人们的工作和生活的同时也造成了