高维复杂数据网络与节点属性的统计推断

来源 :青岛大学 | 被引量 : 0次 | 上传用户:shagen_gw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先研究两个相关关系矩阵(对称矩阵或非对称矩阵)之间的相关关系,给出预测并解决如下问题:网络间相关性检验以及高维网络中包含不可观测的潜变量结构问题。对网络(相关系数矩阵)进行矩阵奇异值分解(SVD)获取低秩因子(潜变量),对低秩因子构建Wilks’Lambda统计量以检验网络间的相关性。若检验显示存在显著线性关系,则对低秩因子构建线性回归模型。若检验结果显示非线性关系,采用非线性模型,并使用极大似然估计法对模型参数进行估计。获取待估低秩因子(潜变量)后,可使用矩阵奇异值分解等方法对低秩因子进行还原,进而可以对网络中缺失地相关关系进行填补,对潜在相关关系进行预测。其次,受正态分布下的精度矩阵相关性质对缺失值识别的启发,对一般连续型分布的样本通过高斯Copula模型转换至正态分布中以识别该分布下缺失值。通过该步预测,为之后的缺失值填补提供合理有效的判断和解释。并针对高维复杂数据的稀疏性、混合数据等特性分别引入逆回归模型,混合数据的潜变量高斯Copula模型等方法以解决相应的问题,为模型推广至高维复杂数据中提供理论支持。最后,通过数值模拟小样本下模型结构,通过对对称网络回归系数、缺失值填补、未知节点关系、以及非对称网络缺失值填补预测等四个实验模拟,发现各评价指标显示相较于对比方法,模型效果较好,且随着数据维度增加,模型效果更佳。在实证分析章节,对四个包括药物结构相似性、靶点蛋白序列相似性和药物与靶点相互作用的数据集进行分析,一致发现在相似性检验以及模型预测过程中均优于对比方法,尤其在降维过程中,降维效果显著。
其他文献
将洪水量作为随机变量,以Rosenbleuth法为可靠度分析方法,评价路基抗冲刷可靠度。为解决定量计算不宜考虑洪水冲刷作用的问题,提出了模糊可靠度方法,将洪水量、路基所处位置
金元四大家:刘河间、张子和、李东垣、朱丹溪,受《内经》启发,并将《内经》的医学心理学思想融合到自己学说之中,形成各自学术特点,指出,金元时期形成了学术急鸣,中医心理学思想得到
造纸白泥作为造纸业的副产品已在部分电厂脱硫中得到应用,但仍然存在一些技术问题。采用XRD、EDS、SEM等表征手段研究造纸白泥的理化特性,分析了白泥脱硫副产品石膏难以脱水
机电安装是一项存在一定的危险性的工程,其安装过程中安全是首要保证的前提。随着我国经济的发展,机电安装工程质量成为当下十分看重的建筑环节。因此,必须加强机电安装质量
化学实验的特点在于反应过程复杂,操作步骤繁琐,安全风险大,对学生的综合素旗要求较高。结合对化学实验的教学体会,通过分析化学实验课程中课前预习、统筹规划时间、仔细观察、尊
脑功能网络探索是揭示大脑处理情绪时潜在神经联系的重要手段,稀疏贝叶斯网络(SBN)方法可以分析各区域因果特性及相互影响,逐渐被应用于脑网络的研究中。本文提取了22名被试
介绍半导体泵浦掺Yb3+增益介质全固态飞秒激光器的结构、工作原理和输出特性,以及飞秒激光的窄脉宽、高峰值功率的优势,根据国内外近期报道的最新研究进展,重点分析分析该类
所谓心理,包括人的感觉、知觉、记忆、思维、意志、情感等心理活动和兴趣、才能、气质、性格等心理特征,是所有精神活动的总称.中医心理学,则是用中医学理论研究心理活动规律
详细论述了应从哪些方面养成学生良好实验习惯的问题。
针对柳赞中、深区块油藏埋藏较深,储层物性较差,泥质含量高,常规酸液体系有效率低(仅为53.3%)等问题,分析了该区块地层特性,确定了影响酸化有效率的因素.通过室内缓速剂评价