论文部分内容阅读
当疾病-基因关联研究中所需检验的标记位点数目很多时,利用实验技术测定所有样本的所有标记位点将使得研究花费很高。故为了提高识别与疾病有关联标记位点的研究效率,研究人员根据所使用试验技术的不同提出了两种类型的二阶段设计:第一种类型设计是两个阶段都利用individual genotyping技术(Satagopan et al.2002;2003;2004);第二种类型设计是第一阶段利用DNApooling技术,而第二阶段利用individual genotyping技术(zuo等2005)。这两种类型设计的共同思想是第一阶段筛查出可能和疾病有关联的标记(亦称候选标记):第二阶段检测并证实和疾病确实有关联的标记位点。
尽管Zuo等(2005)研究了第一阶段存在测量误差的情况,但目前还没人考虑二阶段设计中两个阶段都存在测量误差的情况。故本文先研究两个阶段都存在基因型检测错误的两种类型二阶段设计,并讨论不同误差率对二阶段设计的功效的影响。本文发现,设计的功效本质上仅和群体等位基因的频率及病例组和对照组等位基因频率差有关。当等位基因频率给定时,病例组和对照组等位基因频率差越小,误差对二阶段设计功效的影响越大;而且,误差率不等对设计总功效的影响介于误差率相等的两种情况之间。
另外,还研究了二阶段设计的优化问题,即(1)当研究总费用有限时,本文研究了如何配置资源使得二阶段设计的总功效达到最大,并分析了测量误差对最优设计的影响。经过计算发现,两个阶段中的测量误差对类型I和类型II的最优设计中的第一阶段影响很小,但对整个最优二阶段设计的影响更大些。(2)在一定条件下,讨论了如何配置资源使得二阶段设计相对一阶段设计的费用比达到最小。经过模拟计算本文发现,当待检验的标记位点个数越大时,相比一阶设计,二阶段设计能节省更多费用。值得一提的是,在以上两种优化问题中,类型II的最优不独立设计第二阶段不需要任何额外样本就可能使得设计达到最优。
最后初步讨论了标记位点是不完全独立的情况,提出了一种将多个位点划分成块的方法,由此可利用广义T2检验对块逐个地进行检验。