多层次生物分子网络构建与可视化分析平台研发

来源 :西南大学 | 被引量 : 0次 | 上传用户:adfda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物系统由各类生物分子间的复杂交互构成,现有多种高通量技术可以对分子间的互作进行识别,并通过不同的网络模型进行表示。作为一种重要的计算生物学方法,生物网络建模可以有效地整合多个层面的组学数据,从系统水平对复杂疾病进行研究。但是现有的网络生物学研究仍普遍单独关注基因组,转录组,代谢组或蛋白质组层面的分子网络。事实上复杂疾病并不是单个基因变异,或单个成对基因互作缺失引起的,它们的致病机理异常复杂,通常是由多个基因或不同层次生物分子之间的互作异常引起的,所以从多层次生物分子网络的角度探索复杂疾病的病理是更科学的一种方式。近年来,生物知识的不断积累和多组学数据的井喷式涌现,为建立多层次生物分子网络并以此探索复杂疾病病理提供了契机。本论文的第一部分提出了一种基于多源数据融合和深度神经网络的可变剪接异构体(isoform)-疾病关联识别方法(Isoform-disease associations prediction by data fusion and deep learning,DeepIDA)。同一个基因受可变剪接的影响,可以生成多个可变剪接异构体,进而产生不同的蛋白质变种,可变剪接的异常与多种复杂疾病密切相关。然而现有isoform-疾病关联研究普遍停留在湿实验水平,相关计算学方法缺失,主要原因是缺乏isoform层面的疾病标签数据。为了克服这一难点,本文利用isoform-基因关联将基因层面的疾病标签转移到isoform层面。以此为基础,为了准确预测isoform-疾病关联,DeepIDA通过收集并对齐多层次生物分子关联数据建立了多层次分子网络,同时还额外收集了isoform的序列和表达特征数据。DeepIDA采用两个并行且不同结构的DNN子网络分别从多层次生物分子网络和isoform特征数据中提取整合异构特征,最后融合上述特征进行isoform-疾病关联预测。此外,为有效应对isoform-疾病关联预测中的类别不平衡问题,DeepIDA采用focal loss损失函数代替典型的交叉熵损失函数,以此克服类别不平衡数据中的多数类主导梯度损失方向导致整个模型学习方向偏移的风险。Focal loss可以在平衡正负类别权重的同时降低数据集中大量易分负类的权重,从而使得模型更加关注难以分类的样本。实验结果统计表明,相比于传统机器学习方法,本文提出的DeepIDA方法在多种评价度量上均可显著提升预测精度。Isoform-疾病关联预测研究还处于起步阶段,目前还没有相关的在线计算与可视化平台供研究人员使用,而基因层面的疾病关联预测在线平台已经十分普及。本文第二部分工作参考了大量基因-疾病关联可视化分析平台的设计思路,分析了isoform层面和基因层面的疾病关联预测分析平台中的共性需求,以及isoform-疾病关联分析平台的个性需要,对isoform-疾病关联可视化分析平台进行了详尽的可行性研究和需求分析。其次完成了系统架构设计、数据库设计并基于node.js express框架实现了在线查询模块,用户模块,计算模块以及结果展示模块。其中在线查询模块支持isoform ID查询和isoform序列查询,用户模块包括用户上传数据功能和任务管理功能,计算模块包括用户上传数据的预处理功能和在线计算isoform-疾病关联功能,结果展示模块包括文本结果展示和可视化结果展示功能。
其他文献
用于溶液痕量检测的荧光试纸由于其广泛的生物学和医学应用而备受关注。然而,常规试纸如pH试纸只能使用一次。同样,基于颗粒的传统荧光探针也面临相同问题,他们一般通过纳米
Apolipophorin-Ⅲ(ApoLp-Ⅲ)是存在于昆虫血淋巴中的一种转运脂肪的营养储藏类蛋白,其属于载脂蛋白家族,在脂肪体中合成,主要用于脂质的储藏和转运,在免疫反应、炎症的发生及抵
随着我国的经济、科学技术的发展,人民的生活质量得到了提高,生活方式也有很大改善。光在日常生活中占据重要的角色,它使我们的生活更加丰富多彩。OLED(Organic Light-emitti
6XXX系(Al-Mg-Si-Cu)铝合金属于可热处理强化合金,具有高比强度、耐腐蚀及优良的成形性能,因而是实现车辆轻量化的主要原材料之一;合金中加入Mn/Cr等过渡族元素结合均匀化热
作为影视剧的一支,纪录片以记录真实性见长。随着网络媒介的迅速发展,国外媒体拍摄的纪录片被大量引入。其中,航空事故纪录片因为题材的特殊性,不仅受到广大观众的欢迎,也为
加速器驱动次临界系统(Accelerator Driven Sub-critical System简称ADS)是目前最有效的核废料处理方案。近代物理研究所承担的中国ADS研究项目是加速器驱动嬗变研究装置(Chi
传统的高电压实验室安全防护主要依赖于人工提醒以及工作人员本身所具备的专业知识与较高的安全意识,其次是通过在实验室和操作室门上加装闭锁装置,以此防止实验过程中人员的
依托于我国个人财富市场可观的增长潜力,大数据、云计算、人工智能等互联网技术的发展以及国家政策层面的引导鼓励,近年来我国互联网理财市场发展如火如荼,各大互联网公司和
本报告选取了《球门区》第一至九章作为翻译语料,该小说的作者是唐·德里罗,于1972年出版。小说主要讲述了橄榄球运动员加里·哈克尼斯大学时期的人生经历。所选文本中文化负载词的翻译是难点。本报告以目的论为指导,结合翻译实例,研究了不同类型文化负载词的翻译策略。文化负载词凝聚了民族文化的内涵。恰当的文化负载词翻译,直接影响着文学作品翻译的整体质量和译文读者对原文的理解。在本篇翻译报告中,作者借鉴了彼得·
随着无线数据业务猛增,无线通信业务尤其是面向5G网络和传感器网络的业务面临能耗增高的瓶颈,基于能量采集的协作通信网络(为方便描述,简称为能量采集协作网络)成为新的研究