论文部分内容阅读
细胞中的基因、蛋白质以复杂相互作用关系系统地调控细胞活动。本文利用系统发生谱的逻辑建模和分析方法来鉴别基因间的高阶逻辑关系。细胞核蛋白质相互作用(PIN)数据库与美国国立生物技术信息中心(NCBI)数据库中含有580个相同基因,这些基因都是编码蛋白质复合体亚基的基因,筛选出它们在结肠癌临床Ducks分期的A、B、C期组织(实验组)和正常组织(对照组)中的表达谱,通过Wilcoxon秩和检验选取实验组各期与对照组表达谱有显著差异的153个基因作为疾病候选基因。构建了这些基因包含一、二阶逻辑的网络,比较了不同阈值下不同网络的平均节点强度、平均路径长度和平均聚类系数三个结构参数。通过这些结构参数间的差异性,选取合适的阈值对网络进行粗粒化,得到此阈值下的逻辑网络图。本文关注二阶逻辑对应的基因三元组以及不同期二阶逻辑的类型分布。发现对照组中疾病候选基因间的二阶逻辑类型分布较广且较均匀,实验组各期和对照组中,都不存在第五类和第七类二阶逻辑;结肠癌A期几乎全是第一类逻辑;结肠癌B期和C期主要集中在第一、三、八类。我们认为,基因或蛋白质之间的二阶逻辑可能是生物网络的一类模体,不同类型的二阶逻辑可能对应生命活动中不同的生化反应模式。对照组和实验组各期逻辑网络中二阶逻辑类型分布差异可能说明正常组织和患病组织中生化反应模式的差异。 基因编码的蛋白质大部分都以复合体亚基的形式存在,若干不同的亚基共同形成一个能够完成独立生物功能的蛋白质复合体。为了在蛋白质水平上研究细胞的生理机制,我们将上述获得的基因逻辑序对或三元组中的基因映射到它们所编码的亚基组成的蛋白质复合体上,得到了大量蛋白质复合体逻辑序对和三元组。其中,结肠癌A期复合体逻辑网络中存在大量在端粒盖帽过程中起重要作用的复合体。我们推测可能的原因是细胞在结肠癌A期开始癌变,染色体端粒开始复制,导致大量与端粒维持有关的复合体异常活跃。结肠癌B期复合体逻辑网络中的复合体多数与DNA修复有关。我们推测这可能是因为经历了结肠癌 A期细胞癌变之后,细胞中存在比正常状态下更多的分子损伤,需要 DNA修复机制发挥更强大的作用,以抑制或减缓细胞衰老、死亡或癌化的过程,从而导致与DNA修复有关的复合体异常活跃。结肠癌C期复合体逻辑网络中存在大量与转录有关的复合体。我们推测可能的原因是结肠癌C期癌细胞正在迅速增殖,酶需求量的增加促进了转录的进行,同时与 DNA损伤有关的基因大量转录以抑制癌细胞分化或增殖。对照组复合体逻辑网络中与转录、细胞周期、细胞生长、DNA修复和RNA加工有关的复合体均有出现。我们推测这可能是由于正常组织细胞中需要及时修复不必要的损伤,促进正常新陈代谢反应的产生,与不同细胞过程有关的复合体各自发挥正常功能才能维持细胞功能的正常运行,维持机体的正常生理状态。