论文部分内容阅读
复杂网络的拓扑结构决定了网络表现出来的功能和动态特性。因此在复杂网络分析中,复杂网络拓扑结构的描述以及基于此描述的拓扑结构分析,是两个非常重要的研究内容。除了图论中对网络的基础描述,研究人员提出了非常多的统计特性来描述网络结构,但缺少一种全面的综合的方法来量化描述网络的拓扑结构。对于任意两个给定的复杂网络,单纯的通过比较网络的某一个统计特性的值来衡量两个网络拓扑结构的相似程度也不能获得客观的结果。本文借鉴了模式识别中的相关理论,提出了一种基于最优统计特性特征空间的复杂网络拓扑结构描述方法,得到一组能够有效描述和区分典型拓扑结构的最优统计特性,并由该组统计特性构成多维特征空间。利用不同参数、不同规模的WS小世界网络、ER随机网、BA无标度网络和CNN网络四种典型的网络演化模型生成样本集,并按照可计算性及与拓扑结构的相关性原则挑选出了初始的20个统计特性作为原始特征空间,计算样本在原始特征空间中的特征向量,用SVM分类器验证了上述四种类型的纯拓扑结构的类别可分性。在此基础上按照类内类间距离较大、特征之间冗余度较小等原则设计了准则函数,依照该准则利用模式识别特征降维中的分支定界法对原始的特征空间做特征选择,用SVM分类器对降维后的特征空间进行评估,观察降维效果并选出最优的特征组合,最后得到13个最优的统计特性作为能够有效表达拓扑结构性质的特征空间。本文将这种描述方法应用到复杂网络拓扑结构相似度分析以及复杂网络抽样算法的效果评估中,利用演化网络模型生成的样本对网络拓扑结构进行了相似性分析;将演化模型样本和实证网络样本与三种不同的抽样算法相结合,对抽样效果进行评估。实验结果验证了这一描述方法的可行性及有效性。本文的主要成果在于创新性地将模式识别方法与复杂网络理论相结合,得到了一组能够有效描述网络拓扑结构性质的统计特性。本文的工作成果为复杂网络拓扑结构的研究提供了新的方法和思路,对于网络结构相似度、网络抽样、网络统计特性的分析具有积极的意义。