女性特异性膀胱癌相关基因及其共表达网络分析

来源 :南方医科大学 | 被引量 : 5次 | 上传用户:jycysn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景膀胱癌是指发生在膀胱粘膜上的恶性肿瘤,其分类很多包括膀胱尿路上皮癌,膀胱腺癌、膀胱鳞状细胞癌等。通常我们所说的膀胱癌是指膀胱尿路上皮细胞癌,这种癌症占膀胱癌患者的90%。膀胱癌是我国泌尿系统最常见的恶性肿瘤,而在西方其在泌尿系统相关肿瘤中的发病率仅次于前列腺癌。在美国仅2015年就有7.4万膀胱癌新生病例,占所有癌症新生病例的4.5%。根据美国国家癌症研究所的统计,2015年美国全境有超过1.6万人死于膀胱癌,占由癌症引起的死亡人数的2.7%。2007-2012年在美国膀胱癌的五年生存率仅为77%。通常膀胱癌的发病率会随着年龄的增加而增加,其中50-70段年龄层的人口发病率最高,并且其在男性中的发病率远高于女性。全世界范围内,男性膀胱癌年龄标化的发病率为9.0/10万(居所有恶性肿瘤第七),女性年龄标化的发病率为2.2/10万(居所有恶性肿瘤第十八)。膀胱癌的发病率在发达国家(男性发病率16.6/10万,女性发病率3.6/10万)高于发展中国家(男性发病率5.4/10万,女性发病率1.4/10万)及欠发达国家(男性发病率1.5/10万,女性发病率0.3/10万)。其中欧洲及北美的膀胱癌被认为是膀胱癌高发地区,其男性年龄标化的发病率为20/10万,女性年龄标化的发病率为5/10万,有研究显示近年来这些地区女性膀胱癌的发病率和死亡率有轻微的降低,男性膀胱癌的发病率在减少而死亡率也趋于稳定。在我国,膀胱癌在男性中年龄标准化的发病率为7.37/10万,对于女性其年龄标化的发病率为1.98/10万处于中等水平。但是,由于社会的发展工业化以及人口老龄化等原因,膀胱癌在中国的发病状况不容乐观。有统计显示,近十年来在国内不论是在男性还是女性,农村还是城市,发病率均呈逐年增长的趋势。膀胱癌的发生是一个比较复杂的过程,既与环境因素相关也与遗传因素相关。其中吸烟被认为是导致膀胱癌发生的主要原因。但是,随着社会的发展,女性吸烟人数的增加,女性膀胱癌发病率并没有增加,相反在西方国家有降低的趋势。另外,与联苯胺类化学物质的频繁接触也是膀胱癌的诱因之一。司机、理发师、橡胶工人等与化学物质接触的职业的人群膀胱癌的发病率会更高。膀胱癌的发生同时也与遗传因素相关,有膀胱癌家族史的人患膀胱癌的概率比没有膀胱癌的人概率要更高。一方面这可能与同一家族内有相似的化学接触经历相关,另一方面也可能是与身体对毒素排解相关的一些基因发生改变,导致膀胱癌的发生。另外有对于膀胱癌的遗传性研究显示,膀胱癌患者的二三级亲属的膀胱癌发病率(10%)远高于一级亲属(3%)。大量的针对膀胱癌的癌症基因组分析已经发现癌基因H-ras、FGFR3、erbB2、 CCND1、mdm2,抑癌基因INK4A/ARF、Rb、TP53、PTEN、TSC1、PTCH、DBCCR1等, DNS错配修复基因等基因的突变会与膀胱癌的发生相关。膀胱癌是一种在男性和女性中均会发生的一种泌尿系统恶性肿瘤,其男性发病率是女性的3~4倍。通常吸烟被认为是导致膀胱癌发病率性别差异的重要原因,有研究显示至少一半的男性膀胱癌的发生和三分之一的女性膀胱癌的发生是与吸烟有关。但是有研究显示吸烟并不能完全解释导致膀胱癌发病率的性别差异的原因。因此,有必要在基因水平上寻找膀胱癌发病率性别差异的原因。有实验证明,位于X染色体(q11-12)的雄激素受体(AR)基因可能是导致膀胱癌发病率性别差异的原因之一。雄激素受体与配体结合生成的转录因子可以调节靶基因的表达。实验发现雄激素受体对正常的膀胱癌上皮细胞的生长和维持有着重要的作用。因此,雄激素受体的突变会失去其与配体的结合能力,导致膀胱癌的发生和发展。高通量测序技术的高速发展,对癌症的研究提供了更丰富的平台和数据基础,研究者可以从更多不同的角度,研究癌症在特定时期特定组织的特异性的表达。这些都为人类探索疾病的复杂的发生发展过程提供了良好的分析基础。目前对膀胱癌的研究还不能完全解释膀胱癌的发病机制,以及导致膀胱癌发病率性别差异的原因,因此有必要对其进行进一步的探索。目的本研究的目的在于利用公共数据库TCGA中提供的膀胱癌RNA-Seq数据,筛选潜在的女性特异表达的膀胱癌相关基因。以探究是女性膀胱癌中是否存在与男性不同的与膀胱癌发生相关的基因。同时,通过建立女性膀胱癌潜在相关基因的共表达网络,寻找筛选出女性特异性膀胱癌相关基因所在的共表达模块,通过对共表达网络模块的分析,了解其与女性膀胱癌之间的关系。方法本研究在差异表达分析的过程中使用R平台下的DESeq2和edgeR两种软件。这两种软件都是在R平台中对RNA-Seq差异表达分析比较成熟的软件,并且这二者都是基于基因表达符合负二项分布的假设。由于其对离散度的估计方法不同所以这两种软件在最后筛选差异表达基因结果会有一定的不同。为了使筛选到差异表达基因的结果更可信,我们选取二者分析结果的交集作为最终得到的差异表达基因。为了筛选出女性特异的膀胱癌相关基因,我们对从TCGA数据库中下载的238例膀胱癌相关样本(包括169例男性肿瘤,10例男性正常,52例女性肿瘤,7例女性正常)分别按照性别和癌症、正常分组。首先,分别筛选男性样本中膀胱癌与正常样本之间的差异表达基因,女性样本中膀胱癌和正常样本之间的差异表达基因。其次,对于所有的膀胱癌癌症组织样本我们按照性别筛选男性和女性之间的差异表达基因。最后,将女性膀胱癌与正常组织筛选出的差异表达基因去除在男性样本中筛选出的差异表达基因,并与按照癌症样本的性别筛选出的差异表达基因集取交集。最终得到女性特异性的膀胱癌相关基因。随后使用DAVID对这些基因进行基因注释了解其功能。为了进一步探索我们筛选出的差异表达基因与女性膀胱癌之间的关系,我们使用R语言下的WGCNA软件包,对TCGA数据库中下载得到的52例女性膀胱癌的RNA-Seq数据进行共表达网络的构建。寻找筛选出的差异表达基因所在的模块,并对这些模块进行GO功能分析和KEGG相关通路分析,使用Cytoscape对共表达网络中感兴趣的模块绘制该模块的共表达网络图。本研究中的差异表达分析以及构建共表达网络使用的分析软件DESeq2、 edgeR和WGCNA包,均是R语言平台下提供的生物信息分析软件。R语言是最常用的生物信息分析平台之一。与其他平台相比,R语言最大的优势是其是对使用者是完全免费开源的,并且具有强大的统计分析和图形绘制能力。其包含了多元的软件包,这些包都是由全世界数据分析领域的科研人员共同开发和维护的。结果对238例膀胱癌及其相关样本按照性别、癌症和正常分组,分别进行差异表达分析得到的结果如下:在所有男性样本中,癌症与正常样本之间使用DESeq2筛选出8249个差异表达基因,使用edgeR方法筛选出9048个差异表达基因,两种方法所得差异表达基因的交集有8076个基因。在所有女性样本中,癌症与正常样本间通过DESeq2得到3558个差异表达基因,使用edgeR方法筛选出4823个差异表达基因,两种方法所得到的差异表达基因的交集有3432个基因。在两种不同性别的癌症样本间筛选差异表达基因,DESeq2和edgeR分别筛选得到516和3988个差异表达基因,两种方法所得到差异表达基因的交集中有469个基因。最后我们将在两个方法共同得到的只在女性膀胱癌正常和癌症样本之间表达有差异,且在两种性别的肿瘤样本间表达也有差异的16个基因作为潜在的女性特异的膀胱癌相关基因。这些基因中有10个是表达上调基因,6个是表达下调基因。其中,CD36与微管内皮细胞凋亡的生物学过程相关,参与PPAR信号通路。NRG1是新近发现的一个抑癌基因,可与ERBB3/ERBB4结合促进细胞增殖和分化。COL4A3突变会导致基底膜肾病。TGFBI是转化生长因子β诱导的分泌蛋白,该蛋白具有抗肿瘤的功能。KLKB1调节内在的凝血酶原活性的生物学过程相关是肺癌等诊断的生物标志物。PAQR8可结合孕激素参与卵子生成。对52例女性膀胱癌样本建立共表达网络,得到39个模块,其中11个模块与这16个筛选得到的女性特异的膀胱癌相关基因相关。其中模块grey60包含CD36和CHIN3这两个女性特异性的膀胱癌基因,且这两个基因同时也是这个模块的核心基因。这意味着这两个基因与模块涉及的生物学功能有很大的相关性。CD36与微管内皮细胞凋亡的生物学过程相关,参与PPAR信号通路。通过对这个模块进行生物信息学分析我们同样发现这个模块与PPAR信号通路相关。这样的结果同时也验证了我们共表达网络构建的可信性,以及通过共表达网络模块基因的分析推测筛选出的膀胱癌基因与膀胱癌之间的关系的可行性。模块black包含COL4A3和KLKBl这两个筛选出的差异表达基因,该模块与VEGF信号通路以及非小细胞肺癌相关。对各模块的分析结果也同样与单个基因的功能注释的结果吻合。模块brown包含筛选出的差异表达基因SHOX2,该模块与细胞循环、小细胞肺癌和非小细胞肺癌相关。模块green包含了筛选出的差异表达基因PEX11A,该模块与子宫内膜癌和P53信号通路相关。模块pink包含了差异表达基因LRRC4,该模块同样与P53信号通路,胰腺癌和小细胞肺癌相关。而包含差异表达基因TGFBI的模块steel blue,与NF-kb信号通路相关。同时综合这些模块相关的生物学功能,我们发现这些通路相关的生物学过程之间也存在着相互调节的作用,这些作用的共同发生可能是最终导致膀胱癌发生的原因。讨论本研究通过利用膀胱癌样本进行差异表达分析和共表达网络分析。根据膀胱癌正常和癌症样本,以及样本的性别为筛选因素,筛选出了女性特异性的膀胱癌相关基因。利用女性膀胱癌样本构建出了女性膀胱癌的共表达网络。利用筛选出的基因与其所在共表达网络模块之间的关系,通过对模块内基因集的生物信息学分析,推测筛选出的差异表达基因的功能同时验证其与膀胱癌的相关性。本文最后指出了本研究结果的意义以及不足以及下一步要进行的内容。本研究作为一个探究癌症在性别之间差异的范例,研究中使用的分析策略同样适用于其它水平数据及相关癌症的研究。若通过其它水平的数据得到本文相似的结论,那么分析的结果可能更有参考和指导意义。
其他文献
目的研究附子理中汤对变应性鼻炎大鼠骨髓间充质干细胞增殖的影响及意义。方法复制变应性鼻炎的疾病模型,将36例模型大鼠分为A组(空白组)和B组(附子理中汤治疗),雌雄各半,每
介绍了掘进机的发展历程,总结并分析了我国掘进机发展经历的五个时期。指出了我国掘进机发展过程中存在的一些问题,并提出了我国掘进机的发展趋势。
中国词史上,周邦彦有“结北开南”之功;创伤上由描写客观世界以直接感发的传统特向表现主观内省;发展了以赋为词的创伤手法,变平直为曲折;精通音律,能自度新曲,严守格律而 变化;语言
本文通过对朱启钤创建并推动中国营造学社学术研究发展过程中所体现出来的学术思想、发展策略、研究方法、组织才能等多方面业绩的分析 ,从而揭示其学术思想价值与历史贡献
第一部分TWEAK通过外泌体途径介导巨噬细胞抑制上皮性卵巢癌的转移目的:探讨TWEAK是否可通过外泌体途径介导巨噬细胞对上皮性卵巢癌转移的调控作用。方法:1.PMA诱导人单核细
本报讯(记者陈曦通讯员赵梅香乔剑坤)3月16日,孟津县工商局开出一张营业执照,执照名称上写着“孟津县凤凰山田园综合体有限公司”,此举标志着我省首个田园综合体在洛阳诞生。$$据
报纸
CRISPR/Cas9基因编辑系统是基于细菌和古细菌抵御外源核酸入侵的免疫机制为基础开发出来的一种新型的基因编辑技术,通过RNA介导,特异性地切割外源遗传物质来对抗入侵的病毒和
存在句是英汉两种语言中的常见句型,也是一种特殊句式,有其独特的句法结构和语义特征。现从存在句的定义、分类、特点等方面探讨英汉存在句的相同和不同之处,并对其进行对比
<正> 感叹词是没有涉及内容而纯粹表示感情的词。用于感叹的词语在口语中广泛使用;虽然没有涉及到讲话内容,但是却为讲话内容提供了必要的感情色彩,使口语更富有活力和表达力
经营业绩的评价视角也应在准则变化的影响下有所拓展和延深,尤其在当期国资分类管理的前提下,更应设计有针对性的监管、分析、评价指标,关注“综合收益”项目构成以及数据变