论文部分内容阅读
随着乳腺癌发病率及死亡率的逐年上升、发病患者年龄逐年减小的趋势,提出并推广更精准的新型治疗方法成为乳腺癌临床研究的迫切任务。世界女性晚婚晚育意识的提升,使得越来越多的女性在妊娠期及产后一年内被检测出乳腺癌,即妊娠乳腺癌,其发病期所处的阶段更是限制了临床治疗方式。基因治疗是乳腺癌临床治疗的新型治疗手段。如何更精确有效地从海量基因数据中筛选出乳腺癌临床治疗靶点基因是本研究的出发点。传统聚类方法对基因数据分析时,难以实现一个基因处在多类中的可能,而这却是体现基因间生物功能交互所需要的。为克服此问题并找出乳腺癌基因治疗的临床靶点目标,本研究提出了结合差异化分析和关联规则挖掘的方法,用以筛选乳腺癌致病基因,主要工作成果如下:1.针对基因表达芯片数据,提出了一种基于差异化分析的关联规则挖掘算法。该方法首先结合稳健T检验和倍数方法,分别筛选出妊娠乳腺癌及非妊娠乳腺癌中显著差异表达的基因。对这些差异表达基因及其对应的PTM修饰分别作关联规则挖掘,筛选出有效规则,将两种关联规则对应的基因视为乳腺癌关联基因,并通过生物功能分析,筛选出乳腺癌致病基因。2.依据样本信息,提出一种新的针对差异表达基因集划分基因类的方法。本研究将所有差异表达基因在各样本中的表达水平与平均表达水平作比较,显著高于平均表达水平的样本标记为‘up’,显著低于平均表达水平的样本标记为‘down’,提取各样本中标记为‘up’的基因组成up事务集,标记为‘down’的基因组成down事务集。这种方法打破了传统依据总体样本信息划分基因集的习惯,逐一将各样本表达值与平均表达值比对分析,以样本标记来划分基因。该方法通过逆向考察样本内基因之间的相似性来探索基因之间在生物层面的交互性。本研究得到的乳腺癌致病基因明确表现出了妊娠乳腺癌与非妊娠乳腺癌之间的差异。研究结果显示:在妊娠乳腺癌显著差异表达基因集中的基因,大多为表达下调基因;在非妊娠乳腺癌显著差异表达基因集中、且不在妊娠乳腺癌显著差异表达基因集中的基因,大多为表达上调基因。这一发现,势必推进对妊娠乳腺癌与非妊娠乳腺癌的深刻认识。本研究得到的乳腺癌致病基因具有良好的生物解释性及较高的可信度。最终得到的乳腺癌致病基因与已知乳腺癌相关基因重合度较高,而且这些基因的生物通路富集分析结果显示,它们在多个乳腺癌关键通路中存在显著富集。进一步基因功能注释表明,这些基因皆从不同层面和过程介导着乳腺癌的调控。综上,本研究筛选出的乳腺癌致病基因具有临床医学借鉴意义,为非妊娠乳腺癌及妊娠乳腺癌的基因靶向治疗研究提供了理论支持,也为乳腺癌的诊断、治疗及预后提供了理论依据和方向。