基于关联规则挖掘的乳腺癌致病基因筛选

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ljh6090008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着乳腺癌发病率及死亡率的逐年上升、发病患者年龄逐年减小的趋势,提出并推广更精准的新型治疗方法成为乳腺癌临床研究的迫切任务。世界女性晚婚晚育意识的提升,使得越来越多的女性在妊娠期及产后一年内被检测出乳腺癌,即妊娠乳腺癌,其发病期所处的阶段更是限制了临床治疗方式。基因治疗是乳腺癌临床治疗的新型治疗手段。如何更精确有效地从海量基因数据中筛选出乳腺癌临床治疗靶点基因是本研究的出发点。传统聚类方法对基因数据分析时,难以实现一个基因处在多类中的可能,而这却是体现基因间生物功能交互所需要的。为克服此问题并找出乳腺癌基因治疗的临床靶点目标,本研究提出了结合差异化分析和关联规则挖掘的方法,用以筛选乳腺癌致病基因,主要工作成果如下:1.针对基因表达芯片数据,提出了一种基于差异化分析的关联规则挖掘算法。该方法首先结合稳健T检验和倍数方法,分别筛选出妊娠乳腺癌及非妊娠乳腺癌中显著差异表达的基因。对这些差异表达基因及其对应的PTM修饰分别作关联规则挖掘,筛选出有效规则,将两种关联规则对应的基因视为乳腺癌关联基因,并通过生物功能分析,筛选出乳腺癌致病基因。2.依据样本信息,提出一种新的针对差异表达基因集划分基因类的方法。本研究将所有差异表达基因在各样本中的表达水平与平均表达水平作比较,显著高于平均表达水平的样本标记为‘up’,显著低于平均表达水平的样本标记为‘down’,提取各样本中标记为‘up’的基因组成up事务集,标记为‘down’的基因组成down事务集。这种方法打破了传统依据总体样本信息划分基因集的习惯,逐一将各样本表达值与平均表达值比对分析,以样本标记来划分基因。该方法通过逆向考察样本内基因之间的相似性来探索基因之间在生物层面的交互性。本研究得到的乳腺癌致病基因明确表现出了妊娠乳腺癌与非妊娠乳腺癌之间的差异。研究结果显示:在妊娠乳腺癌显著差异表达基因集中的基因,大多为表达下调基因;在非妊娠乳腺癌显著差异表达基因集中、且不在妊娠乳腺癌显著差异表达基因集中的基因,大多为表达上调基因。这一发现,势必推进对妊娠乳腺癌与非妊娠乳腺癌的深刻认识。本研究得到的乳腺癌致病基因具有良好的生物解释性及较高的可信度。最终得到的乳腺癌致病基因与已知乳腺癌相关基因重合度较高,而且这些基因的生物通路富集分析结果显示,它们在多个乳腺癌关键通路中存在显著富集。进一步基因功能注释表明,这些基因皆从不同层面和过程介导着乳腺癌的调控。综上,本研究筛选出的乳腺癌致病基因具有临床医学借鉴意义,为非妊娠乳腺癌及妊娠乳腺癌的基因靶向治疗研究提供了理论支持,也为乳腺癌的诊断、治疗及预后提供了理论依据和方向。
其他文献
研究目的:美国独立后的体育发展按时间段落进行了科学的划分,美国竞技体育的发展深受英国、德国等一些欧洲国家的影响,多元种族和文化的融合,造就了美国冒险、争先与创新的民
太赫兹成像技术在生物医学、无损检测、工业检验、公共安全领域发挥出越来越重要的作用。然而,受传统太赫兹光学器件衍射极限的制约,现有的太赫兹成像系统的分辨率较低,在应
<正>目的观察浮针加刮痧疗法治疗骨质疏松症腰背痛的临床疗效、作用机理。方法将32例病人均采用浮针针刺和腰背部刮痧治疗。均治疗2周为1疗程,2个疗程为1个观察周期,观察症状
会议
当今智能制造工厂对数控机床的要求日益苛刻,不仅对数控机床的加工精度要求更高,而且需要通过优化车间调度系统来提高企业生产效率和降低生产成本。随着机床零件的生产业务不断增加,原先仅靠单一经验构建的车间调度模式已经远远不能满足现在的制造企业批量生产的需要,因此,企业管理者迫切地需要制定一套良好的生产车间调度方案来满足当今企业发展的需求。本文为解决公司现有高端数控机床的床身、立柱、主轴箱体、滑鞍、工作台等
近期国内诸多城市纷纷展开生活圈相关的研究与实践,新版《城市居住区规划设计标准》中也正式采用"5-10-15分钟生活圈"的分级方式,15分钟生活圈理念为社区服务配套规划打开了
采用艾森克个性问卷(EPQ)、应付方式问卷(CWQ)、匹兹堡睡眠质量指数(PSQI)对200名经历矿难获救的矿工和未经历矿难的220名矿工进行调查。结果创伤组矿工在精神质、合理化、自责、逃
“可否自始即不多讲,而以提问与指点代替多讲。提问不能答,指点不开窍,然后畅讲,印入更深。而学生常听老师提问,受老师指点,亦即于不知不觉之中学会遇到任何书籍文篇,宜如何
期刊