论文部分内容阅读
乳腺癌是女性最常见的恶性肿瘤之一,约占所有恶性肿瘤的23%。近年来,乳腺癌在我国的发病率呈快速增长趋势,尤其在沪、京、津及沿海地区,乳腺癌的发病率己高居女性恶性肿瘤发病率的第一或第二位。乳腺癌己经成为威胁我国女性健康的重大疾病之一。目前普遍认为乳腺癌是由基因和环境共同作用导致的复杂性疾病。大量研究表明,相同环境暴露的个体其发生乳腺癌的危险性并不相同,提示不同遗传背景的个体对乳腺癌的易感性不同。近年来,随着人类基因组计划的完成和国际人类基因组单体型图谱计划的不断推进,以及高通量基因分型技术的日趋成熟,全基因组关联研究(Genome-wideAsoiaion study,GwAs)己经成为乳腺癌等复杂性疾病遗传易感性研究强有力的工具。自2008年8月至今,研究并发表的乳腺癌GwAs研究达到了36项,先后发现了2q35,5p12,10q26等多个乳腺癌易感区域,这些区域所包含的基因在乳腺癌的发生中发挥着重要作用,但上述乳腺癌GwAs研宄大部分以欧美女性为研究对象,由于不同种族间的遗传结构差异性,所发现的遗传变异在中国女性中是否仍是乳腺癌致病相关位点有待进一步验证。另外,绝大部分位点为低共显性位点,其单独的遗传效应相对较弱(0R,Odds ratio:1 2.1 5),是否能够合理有效地应用于乳腺癌的发病风险预测有待进一步研究和评价。因此,本研究的科研假设是:(1)乳腺癌GWAS己发现的遗传易感区域中包含的单核甘酸多态性位点(Single nucleotide polymorphisms,SNPs)与中国女性乳腺癌发病风险存在关联;(2)通过风险预测模型的建立和评价,可以将己知的乳腺癌遗传易感位点和传统的乳腺癌相关危险因素相结合,共同预测女性个体的乳腺癌发病风险。为了验证上述假设,本研究第一部分检索并查阅了2007年至2010年己发表的14篇乳腺癌GWAS文章,并依据以下标准进行选点:(I)HapMap数据库中,中国人群(CHB),稀有等位基因频率(MAF)≥O 05;(II)GWAS报道的乳腺癌遗传易感区域,若一个染色体区域中有多个SNPs位点,验证所有相互间不存在高度连锁不平衡(r2<O 8)的位点的原则,选取了位于11个遗传易感区域的15个SNPs位点,在1792例经病理组织学确诊的新发乳腺癌病例和1867例性别和年龄频数匹配的社区对照中,采用两阶段的研究设计f一期样本量:878vs 900;二期样本量:914 vs 967)进行检测并分析。研究第一阶段检测采用TaqMaaa Oppenay中通量基因分型平台,第二阶段验证则采用TaqMaaa 7900基因分型平台。一期分析结果表明,5个遗传易感区域与中国汉族女性乳腺癌发病风险相关(2q35:rsl3387042,P=0. 039;3p21. 4:rs2307032,P=0. 017;6q22. 33:rs2180341,P=0. 040;6q25. 1:rs2046210,P=1 .26×10-5;10q26. 13:rs2981582,P= 0 .0371。进一步进行二期验证,经多因素Logistic回归分析,调整年龄,初潮年龄,首次活产年龄后,该5个位点均显示了与一期类似的关联结果。在一期和二期合并后的总样本中,显性遗传模型结果显示,5个位点均与乳腺癌发病存在统计学关联(2q35,rsl3387042:调整OR 1 26,P= 0. 006;3q24 1,rs2307032:调整OR= 1. 24,P= 0. 005;6q22. 33,rs2180341:调整OR= 1. 22,P= 0. 006;6q25. 1,rs2046210:调整OR= 1. 51,P= 2.40×10-4:10q26 13,rs2981582:调整OR=1. 31,P= 1.96×10-4)。因此,第一部分研究结果表明,染色体2q35,3p21,6q22,6p25和10q26是中国女性乳腺癌的遗传易感区域,与中国女性乳腺癌的发病存在统计学关联。本研究第二部分根据第一部分中国女性遗传易感位点的筛选、验证结果,分成风险模型的建立和评价两部分。首先选取第一部分中经二期验证的5个与乳腺癌发病独立关联的遗传易感位点(2q35:rsl3387042;:3p21. 4:rs2307032;6q22. 33:rs2180341:6q25. 1:rs2046210:10q26 .13:rs2981582),并结合临床危险因素(初潮年龄和首次活产年龄),以0R值和绝对危险度fabsolute risk)两种不同的统计指标分别建立风险模型,并评价其对乳腺癌预测的效能。建模时分别采用等权重法和0R加权法两种不同的建模策略进行建模。模型评价主要采用经典的受试者工作特征曲线(Recei,e operationchm;acteristic curve,Roc)及其曲线下面积(area under cure,Auc)评价模型的预测效能。R0c分析表明,以0R为基础的风险模型,加权法建立的风险模型Auc=0. 641(95%CI:0. 622.0. 659),其预测效能优于等权重法(Auc:0. 624,95%CI:0. 608.0. 642)P<0. 0001)。以绝对危险度为基础的风险模型,加权法的预测效能同样优于等权重法。以上研究结果表明,将乳腺癌相关的遗传易感位点和传统的危险因素同时纳入预测模型,有助于预测效能的提高,另外,采用加权法建立的风险模型其预测效能优于等权重法。总之,本研究的结果表明乳腺癌全基因组关联研究所发现的遗传位点能在中国女性人群中得到验证,验证得到的阳性位点将有助于提高传统风险预测模型的预测效能,更多遗传易感位点的发现和验证将有利于推进女性乳腺癌个体化风险预测和防治。