【摘 要】
:
网络结构自然地表达事物间的联系,在日常生活的各个方面都有体现。如何合理地表示网络中节点的特征信息是图结构分析的一个重要研究内容。网络表示学习是节点特征学习的一类方法,将网络中的节点特征转化为低维稠密实数向量应用于后续的链接预测和节点分类任务中,传统的网络表示学习方法不足之处在于没有充分考虑节点的全局和局部特征,因此,本文充分考虑网络节点的拓扑特征提出SINE(Second Information
论文部分内容阅读
网络结构自然地表达事物间的联系,在日常生活的各个方面都有体现。如何合理地表示网络中节点的特征信息是图结构分析的一个重要研究内容。网络表示学习是节点特征学习的一类方法,将网络中的节点特征转化为低维稠密实数向量应用于后续的链接预测和节点分类任务中,传统的网络表示学习方法不足之处在于没有充分考虑节点的全局和局部特征,因此,本文充分考虑网络节点的拓扑特征提出SINE(Second Information Network Embedding)算法,并设计基于网络表示学习算法的蛋白质相似性预测算法,具体研究如下:(1)提出了一种融合节点二阶邻近度的网络表示学习算法。充分考虑网络拓扑结构特征,设计节点二阶邻近度计算测度,提出了融合网络中节点一阶、二阶邻近度的方法—SINE,用于丰富网络中节点的特征向量表示,挖掘节点隐藏的更多信息。将SINE算法应用于三种真实数据集,重构其网络结构,得到节点在网络中全局和局部的特征向量表示。通过分析SINE算法与Node2vec算法,以及其他融合了二阶相似度的网络表示学习方法——深层结构网络嵌入SDNE(Structural Deep Network Embedding)和大规模的信息网络嵌入LINE(Large-scale Information Network Embedding),我们发现SINE算法在聚类任务中表现出更好的性能。(2)融合基因本体和蛋白质数据提出一种基于网络表示学习的蛋白质相似性预测模型。我们提出了一种融合基因本体(GO,Gene Ontology)数据的网络表示学习方法来计算蛋白质相似性的模型以便于更好的探究蛋白质之间的关系,传统对GO术语相似性评价的研究主要是基于GO术语之间的信息含量(IC,Information Content)来衡量蛋白质的相似性,GO术语的结构信息反而被忽略。因此,我们考虑GO术语的结构信息,应用不同网络表示学习方法,分别在GO图和GO-蛋白质注释(GOA,Gene Ontology Annotation)图中得到融合网络拓扑结构信息的蛋白质的低维向量表示,用动态时间归整(DTW,Dynamic Time Warping)算法和余弦相似度分别计算GO图和GOA图中的蛋白质相似性,再进行链接预测实验,来评估不同方法构建的蛋白质相似网络的可靠性。相较于传统的IC方法,基于网络表示学习的蛋白质相似性预测表现较为突出,其中基于随机游走的网络表示学习方法在计算蛋白质的相似性方面表现尤为突出,通过参数调节随机游走的采样方式,使其能探索到更多的结构性信息。因此,充分考虑图的结构信息能更有效的预测蛋白质相似性。
其他文献
为解决Ti-6Al-4V钛合金表面激光熔覆Al2O3-ZrO2陶瓷涂层易出现裂纹、气孔等缺陷的问题,有效增强Ti-6Al-4V钛合金耐高温、耐磨损性能,扩大其在高温、重载等严苛条件下的使用范围。综合运用理论分析、有限元仿真及实验研究等方法,开展陶瓷熔覆层裂纹抑制机理研究及熔覆工艺分析。揭示Al2O3-ZrO2熔覆层裂纹萌生及生长机理,阐明激光熔覆工艺对陶瓷熔覆层裂纹敏感性的影响规律。探索并提出钛合
文章为探究互联网金融与银行科技创新能力的内在联系,选取2010~2019年我国26家商业银行数据为样本进行实证分析,以净手续费及佣金收入度量银行科技创新能力,以第三方支付、P2P、余额宝交易规模之和度量互联网金融发展水平。研究结果表明,互联网金融与银行科技创新能力正相关。分组回归后发现,大型银行科技创新能力受到互联网金融的影响相较于小型银行而言更加显著,表明在互联网金融的影响下,大型银行表现出的科
作为机器听觉领域研究最为广泛的技术,自动语音识别在智能家居、智能汽车、智能手机虚拟助手等场景下都有非常重要的应用价值。在理想环境下,自动语音识别的精度已经接近饱和。但是在噪声场景尤其是高噪声场景下,受稳态和非稳态噪声的影响,语音识别的精度出现大幅度下降乃至完全失去识别效果。同时,在一些特定的对能源使用要求较为严苛的军事应用场景,如航空航天卫星、全天候陆地侦察车等,对低功耗的嵌入式语音识别方案有较大
近年来,深度神经网络(Deep Neural Network,DNN)在图像分类任务中取得了显著的效果。然而,对抗性机器学习领域的进展使得DNN不再可靠。通过在良性图像上添加精心设计的扰动(即对抗攻击),产生的对抗样本可以轻易骗过最先进的DNN,这不可避免地引起了人们对所部署模型稳定性的担忧。因此,尽可能多地暴露DNN的“盲点”是当务之急。在所有的威胁模型中,黑盒攻击是最具挑战性和最实用的,因为部
基于核心素养的要求,通过对传统的知识链接型、实验传递型课堂的分析,结合初高中教材对《功》的编排特点,设计以贴近学生生活的真实情境为中心、以任务引导为手段的创新型教学方式,以期为高中物理课堂教学改革提供借鉴。
在针对遥感图像的目标检测应用中,对重要物体的关键部位进行目标检测具有重大的研究价值,在军事上,可以利用关键部位目标检测发现具体要打击的部位,从而进行精确打击。经过测试,现有的目标检测算法针对小目标物体的关键部位检测会发生许多漏检的情况,究其原因是小目标物体的关键部位检测更加具有挑战性。为了解决现有技术进行关键部位目标检测精度不佳的问题,本文围绕神经网络轻量化技术、关键部位目标检测技术、神经网络结构
随着深度学习研究的不断扩展,自监督学习作为一种新兴的无监督学习方法,被用于训练网络在无标注的数据集上进行表征学习,目前已经在计算机视觉领域中取得了一定的成果。为了从无标注数据中学习通用视觉特征,研究者利用自监督学习方法提出了一种常用的解决方案,即设计不同的代理任务供网络求解。同时,网络在优化代理任务中的目标函数的过程中得到了训练。然而,在现有的自监督学习方法中,研究者通常利用网络外部信号设计自监督
教智融合背景下,虚拟仿真技术不断走进中学物理课堂,引起物理教学的又一轮革新。本文以“电流热效应”教学为例,主要从“创设生活情境,感知概念;创建探究实验,建构概念;联系生活实际,升华概念”三个方面出发,利用NOBOOK虚拟仿真实验进行物理教学,旨在克服传统实验不足,提高课堂效率和实验效果。
深部围岩动力灾害发生的本质在于围岩积聚能量的突然释放,通过锚固支护实现能量的有效吸收是围岩控制的常用手段,也是围岩动力灾害控制的关键。锚固岩体动力特性及控制机制研究是锚固支护合理设计的前提。基于此,本文研发了新型高强、高延伸率、高吸能特性恒阻吸能支护材料,开展了恒阻吸能锚固岩体动力试验,分析了锚固岩体的动力学响应特征与能量演化规律。结果表明,与无锚岩体相比,恒阻吸能锚固岩体表面损伤率和体积损伤率分
辐射供冷空调系统因其具有节能、热舒适性好及噪音低等优点,被人们广泛关注并加以使用。本文所研究的埋构式地板辐射供冷系统是一种新兴的辐射供冷空调系统,其独特之处在于该类型的辐射地板是将换热盘管预埋于建筑现浇混凝土结构层中,换热盘管与结构层形成一体并直接作为供冷的末端。与传统辐射供冷系统相比,埋构式地板辐射供冷系统除了具有节能、热舒适性好的优点之外,还不占用建筑层高、不限制楼板承重,逐渐受到关注。辐射地