论文部分内容阅读
结直肠癌(colorectal cancer,CRC),又称为大肠癌,是一种常见的消化道恶性肿瘤。在世界范围内,结直肠癌的发病率在女性常见肿瘤中排第二位,在男性常见肿瘤中排第三位,是死亡率位居第二位的癌症。世界卫生组织国际癌症研究机构(international agency for research on cancer,IARC)的统计数据显示,2008年全球结直肠癌新诊断病例达120万例,结直肠癌导致的死亡人数占全部癌症死亡人数的8%。近几十年来,结直肠癌的整体发病率和死亡率都在逐年增高。尤其是在我国,随着国民经济收入和生活质量的提高以及生活习惯的改变,结直肠癌在中国人群中的发病率和死亡率均快速攀升,该病在我国已是发病率第三位和死亡率第五位的恶性肿瘤,逐渐成为威胁人民健康和生命的杀手。根据肿瘤的局部浸润(T)、区域淋巴结转移(N)和远处器官转移(M)这三个要素的情况,学者们提出了结直肠癌的TNM分期。TNM I期和II期结直肠癌治愈希望较大,TNM I期病人的5年生存率达到了90%,但是如果癌细胞扩散到淋巴结中(TNM III期)时,手术和放化疗等治疗手段只能使73%的病人获得治愈的可能,当肿瘤继续发展至肝脏、肺等远处器官转移时(TNM IV期),绝大多数病人已失去了根治性治疗的可能性,其远期效果一般也极差。故早期诊断和治疗是结直肠癌病人获得良好预后的关键所在。生物信息学是涉及多个领域的一门交叉学科,其核心内容之一就是研究基因表达调控的内在机制,揭示人类疾病的本质规律,为更快速、准确的诊断和有效的治疗疾病创造了条件。本研究旨在应用基于芯片数据的生物信息学分析筛选出结直肠癌组织及其配对的癌旁非癌组织间的差异表达基因,同时搜索结直肠癌基因(即种子基因),继续通过构建蛋白质—蛋白质相互作用网络、重启型随机游走分析、富集分析和药物—基因相互作用等手段探索出可能与结直肠癌发生发展相关的关键作用基因并初步分析其功能。然后通过检测关键基因在结直肠癌组织和细胞系中的表达情况,及其对结直肠癌细胞增殖、细胞周期和细胞凋亡的影响,来验证生物信息学分析的结果,为进一步研究关键基因在结直肠癌中的分子机制提供依据,为找到应用于结直肠癌诊断和治疗的新基因靶点带来了可能性。从基因表达综合数据库(Gene Expression Omnibus,GEO)下载到包括17对结直肠癌组织及其配对的癌旁非癌组织的基因芯片数据系列GSE32323后,结合Bioconductor中的AFFY软件包和Brain Array Lab提供的Affy芯片探针注释文件对表达谱芯片数据进行标准化预处理。然后,用R语言中的limma软件包对上述预处理过后的表达矩阵进行差异表达分析,以筛选出结直肠癌组织及其配对的癌旁非癌组织间的差异表达基因。同时,从在线人类孟德尔遗传(Online Mendelian Inheritance in Man,OMIM)数据库中搜索了结直肠癌基因,即种子基因。随后,在检索相互作用基因的检索工具(Search Tool for the Retrieval of Interacting Genes,STRING)数据库下载了蛋白质互相作用背景网络,并从中提取只包含种子基因和差异表达基因之间相互作用的子网络命名为CRC.PPI网络;接着又使用R语言中的dnet软件包进行了重启型随机游走分析,识别出了CRC.PPI网络中亲和力分数较高的前50个节点,并对前50个节点中的差异表达基因进行了基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析;之后,通过DGIdb数据库进行了药物—基因互相作用分析,以寻找可能对我们关注的基因起到调节作用的抗肿瘤药物。利用PCR检测结直肠癌组织和三个结直肠癌细胞系中关键基因的表达情况。然后,通过MTT等检测关键基因沉默对结直肠癌细胞SW480细胞增殖的影响。最后,利用流式细胞技术检测了关键基因沉默对结直肠癌细胞SW480的细胞周期和细胞凋亡的影响。我们得到了1640个差异表达的基因,这些差异表达基因中有850个是表达上调的,790个是表达下调的,并且从OMIM数据库中搜索到了CCND1、AURKA和TLR4等25个种子基因。用STRING数据库将CRC.PPI网络构建完成后,我们进行了重启型随机游走分析,识别出了该网络中亲和力分数较高的前50个节点,包括DEP结构域含有雷帕霉素靶蛋白相互作用蛋白(DEP domain containing MTOR-interacting protein,DEPTOR),乳腺癌扩增序列-1(breast carcinoma amplified sequence-1,BCAS1),神经前体细胞表达发育下调9(neural precursor cell expressed developmentally down-regulated 9,NEDD9)和有丝分裂原激活蛋白激酶2(mitogen-activated protein kinase kinase 2,MAP2K2)等。在CRC.PPI网络中亲和力分数较高的前50个节点包括14个上调基因,17个下调基因和19个无差异表达的基因,它们之间有224条相互作用的边,包括DEPTOR-CCND1,AURKA-BCAS1,CCND1-BCAS1,CCND1-NEDD9和CCND1-MAP2K2等。我们从前50个节点中总共筛选出31个差异表达基因,其中只有5个是种子基因,另外26个是非种子基因。以p值小于0.05为筛选标准,我们利用DAVID在线工具对这31个差异表达基因进行了GO功能和KEGG通路富集分析。GO功能富集分析发现,这31个基因主要富集在细胞周期阶段(cell cycle phase;p=0.005651;涉及CCND1,NEDD9和AURKA),细胞周期(cell cycle;p=0.045692;涉及CCND1,NEDD9和AURKA)和细胞内的信号级联(intracellular signaling cascade;p=0.01978;涉及CCND1,MAP2K2和AURKA)等中。另外,KEGG通路富集分析发现这31个基因还富集到了细胞因子-细胞因子受体相互作用(cytokine-cytokine receptor interaction,p=0.04602)中。从DBIdb数据库筛选可能作用于31个差异表达基因的药物,发现只有3个基因(包括CCND1,AURKA和DEPTOR)存在可能的与它们表达变化逆向作用的药物。鉴于生物信息学分析的结果表明差异表达基因CCND1,AURKA和NEDD9是亲和度较高的节点且均富集到了细胞周期等多个重要的功能和通路中。因此,我们后续进一步研究了这三种基因在结肠癌中的表达和功能。应用半定量PCR和/或实时定量PCR检测进行实验研究,发现CCND1,AURKA和NEDD9在结直肠癌组织和三个细胞系中都有不同程度的表达上调,以AURKA最为显著,CCND1次之。MTT、CCK-8和流式细胞术的结果表明,分别沉默AURKA和CCND1后SW480细胞的G1-S细胞周期进程受抑制,导致细胞的增殖能力显著下降;而且结直肠癌细胞SW480的凋亡增加。总而言之,我们尝试了用各种生物信息学分析方法来挖掘结直肠癌相关的基因,用相关实验技术检测了关键基因在结直肠癌组织和细胞系中的表达情况,并对这些关键基因进行了初步功能分析探索。发现与正常样本相比,在结直肠癌样本中我们总共筛选到1640个差异表达基因。其中如DEPTOR,AURKA,CCND1,BCAS1,NEDD9和MAP2K2等亲和度较高的基因可能通过影响细胞周期、参与信号通路等方式影响了结直肠恶性肿瘤的发生发展过程。而且,我们检测到了可能作用于CCND1,AURKA和DEPTOR的药物。然而,这些都是通过生物信息学分析得到的预测性结果,需要通过实验研究来进一步验证它们的准确性。随后,我们通过实验检测发现CCND1和AURKA在结直肠癌组织和SW480细胞中显著上调表达。此外,AURKA或CCND1沉默后,SW480细胞的G1-S细胞周期进程受抑制,导致细胞的增殖能力显著下降;而且,SW480细胞的凋亡增加,提示AURKA和CCND1可能是结直肠肿瘤发病机制中的重要基因,并通过影响细胞周期来调控结直肠癌。这与前面生物信息学分析中关于关键基因筛选及其作用机制的结果基本一致。因此,我们目前的研究结果对今后进一步深入探索结直肠癌的早期基因筛查和靶向治疗有重要的启示作用,也为分析、探索通过生物信息学筛选出来的其他差异表达基因在结直肠癌中的作用提供了前提和理论基础。