基于TCGA数据的肿瘤预后相关基因数据库的构建

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:BalloonMan_Again
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:肿瘤是指组织细胞不受控制地异常增生而逐步形成的肿块,可以分为良性肿瘤和恶性肿瘤两大类。恶性肿瘤中起源于上皮组织的称为癌,起源于间叶组织的称为肉瘤。恶性肿瘤是危害人类健康的主要因素之一,2018年全年全球死于恶性肿瘤的人数接近1000万。肿瘤标志物是由肿瘤细胞产生的或者被肿瘤细胞影响的正常细胞产生的,具有表征肿瘤发生、预后的物质。材料与方法:用于筛选独立预后基因的肿瘤RNA-seq数据和对应肿瘤的临床数据下载自TCGA数据库旗下的GDC网站。对于没有临床正常样本的肿瘤,我们下载了GTEx数据库的正常样本进行了补充。大致方法如下:1,我们对RNA-seq数据进行了清洗,并将Ensemble名称转换成了基因名;2,通过差异分析,得到在肿瘤样本和正常样本中差异表达的基因;3.将得到的差异表达基因表达数据与生存数据合并分析,得到和生存相关的差异表达基因;4.将前两步筛选得到的基因表达数据与临床数据合并,做多因素COX分析,筛选可以作为独立预后因子的基因;5.对于可作为独立预后因子的基因,我们绘制1年生存率的接受者操作特性曲线(ROC曲线),并且计算曲线下面积AUC,筛选AUC>0.6的基因作为最终结果;6.分析得到的独立预后基因与临床性状的相关性;7.对得到的独立预后基因进行GO和KEGG富集分析;8.运用C#,HTML,CSS等编程语言,构建在线服务数据库,将所得到的结果展示在网站上。结果:我们最终在9个肿瘤中筛选得到了肿瘤的独立预后基因。我们在膀胱尿路上皮癌中筛选到了43个基因;在肾透明细胞癌中筛选到了124个基因;在肾乳头状细胞癌中筛选到了237个基因;在胰腺癌中筛选到了86个基因;在结肠癌中筛选到了20个基因;在肝癌中筛选到了1194个基因;在肺腺癌中筛选到了113个基因;在胃腺癌中筛选到了21个基因;在甲状腺癌中筛选到了19个基因。我们对筛选到的基因进行了GO、KEGG富集分析,有一部分肿瘤的独立预后基因未富集到结果。富集到结果的肿瘤有富集到葡萄糖-6-磷酸的糖酵解过程,氨基酸的生物合成等重要的生物学过程。最后,我们将得到的具有独立预后功能的基因的差异表达图,生存分析图,ROC曲线图展示在网站上。总结:通过一系列的生物信息学分析,我们最终筛选到了一大批具有独立预后功能的基因,其中包括了表达蛋白的基因和没有对应蛋白的基因。在这些基因中有一些已经被报道和对应的肿瘤相关,或者被报道可以作为独立预后基因。而大部分基因此前尚未被报道。希望我们的工作能够对其他科研工作者提供帮助。我们的工作数据来源目前完全来自TCGA,后续我们将会加入其他来源的数据。
其他文献
作为评估导航卫星系统的四个核心指标之一,完好性受到了民航领域的高度重视,是保证民航安全运行的重要条件。高级接收机自主完好性监视(Advanced Receiver Autonomous Integr
电力工程建设水平的提高,拖动了国民经济的高效发展,但电力工程建设任务不断增多的过程中,也突出了电力工程造价管理中的诸多问题。电力工程建设单位要想在激烈的市场竞争中占据
随着高速铁路的快速发展,对运行速度和稳定性提出了更高的要求,CRTSⅢ型无砟轨道板,作为高铁高速稳定运行的基石,应用更加广泛。CRTSⅢ型无砟轨道板,长5600毫米,宽2500毫米,
目的观察钙激活钾通道和蛋白激酶C是否参与远距后处理的心肌保护作用及其可能机制。方法雄性SD大鼠在体结扎冠状动脉模拟心肌缺血复灌模型。结扎大鼠右侧股动脉5 min,松开5 m
本翻译实践报告基于《爱尔兰革命1897-1923》一书中的第九章《工人阶级运动和爱尔兰革命1896-1923》和第十章《新芬党、土地激进主义和独立战争1919-1921》的英译汉翻译实践
文学作品不仅是作者个人意志的体现,更是特定时代的文化产物,可以传播文化、传递情感、输出价值。蔡崇达的叙事散文集《皮囊》,全面展现了闽南地区的民俗文化,揭示了原生家庭