【摘 要】
:
不同的癌症类型会具有某些共性,这种共性体现在可能共享一些重要通路,一旦通路中的任意一个驱动基因发生突变都会导致这些通路失活,从而引发癌症的产生和发展,这从分子层面揭示了不同癌症的共同致癌原因。识别不同癌症之间的公共驱动通路对于设计有效且通用化的癌症治疗方法至关重要,大量组学数据的产生和积累已使其成为现实。一方面,分析泛癌数据能够在不同癌症中发现基因组图谱之间的相似性。另一方面,通过整合例如基因组学
论文部分内容阅读
不同的癌症类型会具有某些共性,这种共性体现在可能共享一些重要通路,一旦通路中的任意一个驱动基因发生突变都会导致这些通路失活,从而引发癌症的产生和发展,这从分子层面揭示了不同癌症的共同致癌原因。识别不同癌症之间的公共驱动通路对于设计有效且通用化的癌症治疗方法至关重要,大量组学数据的产生和积累已使其成为现实。一方面,分析泛癌数据能够在不同癌症中发现基因组图谱之间的相似性。另一方面,通过整合例如基因组学和蛋白质组学等多种癌症组学数据能够减少单一组学数据带来的噪声、数据不完整等问题。由于结合了蛋白质组学,会考虑到蛋白质之间的相互作用,因此驱动模块是基于蛋白质的相互作用下对驱动通路的另一种描述。围绕这些问题的研究,本文主要工作如下:在数据处理方面,由于泛癌数据通常是通过从不同癌症样本基因集的交集中识别驱动模块,一些对癌症发展至关重要的基因可能会被忽略。为了解决这个问题,首先设计了一种基于K-最近邻的插补算法KNNImp来推断一些潜在的重要缺失基因的突变值。该算法首先选定插补基因,然后通过计算样本之间的相似性,以相似性最高的前K个样本中插补基因对应基因的突变情况来判断该插补基因是否突变。最后从所有可能突变的样本中选择优先插补的样本以预测插补基因中该样本的突变情况。使用真实生物数据,在处理前的原始数据集和做插补处理后的插补数据集上使用驱动模块识别算法,对识别出的驱动模块进行对比分析。实验结果表明,所提出的插补算法确实在恢复一些重要的癌症相关基因方面发挥了作用,能够提升模块识别算法的识别效率。在模块识别方面,本文针对泛癌公共驱动模块识别问题,考虑了各个癌症之间突变频率的差异,基于调和均值定义互斥度和覆盖度,识别一组非重叠的模块集合,提出了最大化泛癌公共驱动模块集合分数PCDMSS(pan-cancer common driver module set score)模型。针对该模型,提出了一种基于层次聚类的泛癌公共驱动模块识别方法HMCEwalk,它使用各种癌症类型之间基因覆盖度分数和互斥度分数的调和平均值对集成的PPI网络进行加权,并通过随机游走过程提取模块。实验在模拟数据和真实生物数据上进行。在模拟数据上的实验结果表明,对于两种类型的癌症,HMCEwalk算法更倾向于识别一组模块,这些模块不仅在这些癌症的大部分样本中发生突变,并且每种癌症的突变样本比例接近。在生物数据上的实验结果表明,将识别性能与两种最先进的计算方法MEXCOwalk和Drive Ways进行比较,所提出的方法在大多数情况下在恢复已知癌症基因、生成满足每种癌症的覆盖度和互斥度的模块方面表现出更加优秀的性能,并且许多识别出来的模块都涉及已知的与癌症相关的生物通路中。此外,所提出的方法确实识别出许多被MEXCOwalk和Drive Ways方法遗漏的癌症相关基因。综上所述,本文对泛癌驱动模块识别问题进行研究,提出了基因插补算法KNNImp,重新定义了泛癌公共驱动模块识别模型,并提出求解该模型的泛癌驱动模块识别方法HMCEwalk。
其他文献
目的:探讨神经外科中药处方分析与管理方法,以促进中药在神经外科临床中的发展。方法:从2021年医院神经外科中随机抽取800例住院患者,开展回顾性处方和病历资料分析。结果:纳入患者主要诊治疾病为偏瘫、脑出血后遗症、脑梗死后遗症、脑外伤后综合征、腔隙性脑梗死等。神经外科常见的10种中药有艾叶(艾灸片)、川芎、当归、甘草、连翘、伸筋草、红花、广藿香、陈皮、吴茱萸等。结论:神经外科中药的使用以艾叶、川芎、
随着互联网的快速发展,智能手机、社交网络深入到人们生活中的方方面面,如图像和短视频等多媒体资源时刻都在产生。多媒体资源作为数字产品,本身含有价值,能够通过交易进行流通以获得收益。现有中心化的多媒体资源交易方式存在第三方不可信赖及数据丢失不可恢复的风险,且多媒体资源易转发、可复制、可编辑的特点也导致其存在难确权、权益难保障等问题,多媒体资源交易过程中存在的交易安全及信息隐私保护等问题也亟待解决。不仅
目的:糖尿病肾脏病(Diabetic kidney disease,DKD)是糖尿病主要的慢性并发症,易进展为终末期肾脏病而需要透析治疗,死亡率较高。我们的前期基础研究显示NOD样受体蛋白3(NOD-like receptor thermal protein domain associated protein 3,NLRP3)炎性体通路可能参与了DKD的发生、发展,但目前尚无DKD患者该通路变化的
缬氨酸是三大支链氨基酸(BCAA)之一,具有调控动物蛋白质合成、生长代谢、机体组织修复并提供能量等生物学功能。在泌乳母猪饲粮中添加缬氨酸可提高母猪采食量、泌乳量,改善乳品质。本文主要综述了在泌乳母猪饲粮中添加缬氨酸对母猪生产性能、泌乳性能以及对仔猪生长发育的影响,旨在为缬氨酸在泌乳母猪生产中的应用提供理论参考。
CO2排放导致的一系列环境问题,引起广泛关注,金属有机框架(MOFs)因其超高的孔隙率比表面积,被认为是捕集CO2的理想材料。采用微波辅助合成Ni-gallate(镍基没食子酸金属有机框架),并借助扫描电子显微镜(SEM)、傅里叶变换红外光谱(FT-IR)、X射线衍射(XRD)等表征手段进行分析。结果表明:相较于传统水热合成,微波辅助合成的材料有着较高的结晶度和规则的尺寸形貌,在25℃时表现出更高
目的:分析高白细胞急性白血病(Hyperleukocytic acute leukaemia,HAL)患者的临床特点、早期死亡(Early death,ED)和预后情况,并分析中性粒细胞与淋巴细胞比值(Neutrophil/lymphocyte,NLR)、淋巴细胞与单核细胞比值(Lymphocyte/monocyte,LMR)、红细胞压积(Haematocrit,HCT)、红细胞平均血红蛋白量(M
图像是人类视觉的基础,包含着丰富的语义信息。在工业实际应用中,获取清晰图像是进行目标识别和缺陷检测的前提。其中,对字符图像这类多纹理图像的去运动模糊复原更具有挑战性。目前,得益于卷积神经网络对图像特征信息的良好提取和灵活表达,基于深度学习的图像去运动模糊研究取得了一定的进展。因此,旨在满足应用于工业领域的速度、最大化复原运动模糊字符的纹理细节,保障归一化检测流程的顺利推进,本文将基于生成对抗网络对
目的:回顾性分析贵州医科大学附属医院过去6年内行异基因造血干细胞移植(Allogeneic hematopoietic stem cell transplantation;Allo-HSCT)的成人急性白血病(acute leukemia;AL)患者的生存情况,探讨影响其预后的相关因素。方法:回顾性分析2014年1月至2020年12月在贵州医科大学附属医院接受异基因造血干细胞移植的成人急性白血病患
目的:探讨原发性局灶节段性肾小球硬化症(focal segmental glomerulosclerosis,FSGS)患者临床疗效及近期预后的相关影响因素。方法:收集2015年8月至2019年12月贵州医科大学附属医院肾病风湿免疫科收治的FSGS患者,共79例。根据纳入排除标准,最终纳入60例以肾病综合征为临床表现的原发性FSGS患者。收集患者性别、首诊时年龄、首诊时24小时尿蛋白定量、血清白蛋
目的 采用HPLC建立同时测定天麻中9种成分含量的方法,并结合化学模式识别技术,分析可区分野生和栽培天麻的差异成分。方法 采用Phenomenex C18色谱柱,以乙腈-0.1%甲酸水为流动相进行梯度洗脱,以270 nm为检测波长,流速为1.0 mL·min–1,对20批野生和栽培天麻中的天麻素、对羟基苯甲醇、对羟基苯甲醛、巴利森苷A、巴利森苷B、巴利森苷C、巴利森苷E、原儿茶酸、香兰素共9种成分