论文部分内容阅读
目的: 本课题利用基因表达综合数据库(Gene Expression Omnibus, CEO)查找口腔鳞状细胞癌(Oral Squamous Cell Carcinoma,OSCC)相关的基因表达谱芯片,下载芯片数据并构建表达矩阵,筛选OSCC和正常口腔组织之间的差异表达基因(Differentially Expressed Genes, DEGs)。从而为确定口腔鳞状细胞癌的关键基因以及疾病预防、早期诊断和药物靶点治疗等提供理论依据与参考。 方法: 从GEO公共数据库下载mRNA表达谱芯片数据GSE31056,从96个组织样本中选择23个正常口腔组织样本及23个OSCC组织样本。使用Rstudio软件,基于R语言环境,利用Bioconductor中的Impute软件包和 Limma软件包对数据进行预处理并且筛选出差异表达基因(DEGs)。使用 Heatmap软件包对变化显著的差异表达基因进行层析聚类分析及可视化处理。使用clusterProfiler软件包对得到的差异表达基因进行GO功能注释和KEGG通路富集分析。将OSCC差异表达基因导入 STRING数据库,构建蛋白质-蛋白质相互作用网络(PPI),并将其导入 Cytoscape软件进行可视化处理并构建蛋白质互作网络的子网络。 结果: 通过上述方法,成功筛选出715个差异表达基因(基因表达倍数变化≥2),与正常口腔组织样本相比,有258个基因呈现上调趋势,457个呈现下调趋势。在蛋白质互作(PPI)网络中, SPP1、MMP1、MMP7、MMP9基因具有较高节点,并且与周围蛋白质存在较多互相作用。这些基因可能成为OSCC发生、发展的潜在生物标记, 结论: 本课题基于生物信息学的R语言环境通过mRNA表达谱芯片,筛选出口腔鳞状细胞癌和正常口腔组织之间的差异表达基因。通过对差异表达基因相关的蛋白质互作网络分析筛选出度值最高,与周围蛋白质互相作用最多的基因。从而为确定口腔鳞状细胞癌的关键基因以及疾病预防、早期诊断和药物靶点治疗等提供理论依据与参考,为我们后续的实验提供新思路。