论文部分内容阅读
目前,对多中心临床试验资料的分析,多以传统的统计方法为主。这些方法或者忽略些本应该考虑的协变量,如中心效应,或者是对一些不满足经典统计方法前提条件的数据不进行处理。如多中心临床试验中,同一中心的病人之间有一定的相关性,在以往的研究和方法中并没有考虑。以往研究忽视中心间的异质性,即是没有考虑中心效应。有些虽然考虑到中心间可能的异质性,但采用固定效应模型,使得结论不能广泛推广。归根结底,问题表现在两个方面:一方面是没有考虑中心效应,另一方面是没有考虑同一中心中的病人之间的相关性。正是这两方面的特殊性,使得在多中心临床试验中,许多基于独立性、正态性、方差齐性的统计方法难以应用。随机效应模型的发展为此提供了一个良好的思路,也可以考虑中心效应,将中心效应作为随机效应来处理,也考虑了同一中心的病人之间的相关性和数据的层次结构,使得结论可以推广到整个人群。在多中心临床试验中,可以把中心的水平当作随机效应用随机效应模型来模拟分析,因为随机效应模型的拟合即考虑了中心水平的差异,而且考虑了个体之间的差异。随机效应模型是目前多中心临床试验资料分析中一种比较好的分析方法。目的研究和分析随机效应模型在多中心临床试验中应用,并与以前的统计分析方法(不考虑中心效应或是中心和治疗的交互作用)和固定效应模型(中心效应作为固定效应)进行模拟比较研究。比较限制性极大似然估计(REML)法和贝叶斯法(Bayesian)对小样本不平衡单因素随机效应模犁方差成分估计的偏差和精密度,同时考虑在样本量的大小、单位的数量和单位内相关系数(ICC)的大小不同的情况下对方差成分估计的精确程度的影响。探索性的比较了几种常用的软件(SAS,S-PLUS,STATA)之间的差异,研究三个软件之中哪一个软件可以得到更加精确的方差成分可信区间的估计,为随机效应模型的参数估计方法的选择提供参考和在实际的研究中选择合适的统计分析软件方法第一,用SAS软件中的RANNOR函数模拟产生病人(试验组和对照组)的主要疗效指标的值,然后用SAS中的PROC PLAN过程把病人分别按照不同的设计随机(区组随机)的分配各个中心。最后分别用四个模型进行拟合估计和评价,以上四个模型都在SAS PROCMIXED过程可以实现,PROC MIXED过程我们采用限制最大似然估计法(REML)进行参数估计。第二,通过计算机模拟7组不同设计的数据集,用SAS软件MIXED模块进行方差成分估计,分别用REML法和Prior过程中的贝叶斯法估计。第三,用SAS软件根据不同的参数值模拟产生数据集,随机模拟5000次,关于组间方差的95%的可信区间的估计,分别从SAS软件的PROC MIXED和S-PLUS软件的LME和SATAT软件的XTMIXED三个过程中估计得到,其中三个软件的默认设置都是用REML估计方法。结果在多中心临床试验中,几种模型对治疗效应的估计的都是无偏的,偏差的绝对值在0.01到0.03之间,均方误差(MSE)在0.001到0.003之间。不同的设计中,REML法估计比Bayesian法估计更加接近真值,但Bayesian法对组间方差的区间估计更加精密。对于两种方法而言,样本和单位数量的增加,估计结果更加准确。组内方差的估计,比组间方差的估计更准确和精密。当组间方差等于1.5时,PROC MIXED过程不适合,我们可以用LME或者XTMIXED来进行估计。当相关系数很小时,PROC MIXED和LME与XTMIXED的差别越明显。此外,当相关系数很小时,三个软件的可信区间的宽度向更大的方向偏。结论多中心临床试验统计分析中,经典的统计分析方法,如固定效应ANOVA模型简单易行,但是将中心效应视为固定效应,无法分析哪些因素对因变量的变异程度有影响,提供的信息比较有限,结论不能广泛推广,而临床试验的目的是要推广到整个人群。随机效应模型充分的考虑了数据间的相关性问题,并把中心效应作为随机效应来处理,对研究因素可做出正确的估计和假设检验。关于随机效应模型的方差成分估计方法比较,在对小样本不平衡结构数据,当ICC为小或中等时,REML估计比Bayesian估计的偏差和均方误差要小,推荐使用。但是Bayesian法的区间估计比REML法的区间估计更加精密。当今有很多的统计软件可以来拟合随机效应模型,而且越来越的研究者在运用这些软件来拟合模型和参数估计。当我们在对方差成分可信区间估计的时候,我们必须防止想当然的使用软件,要了解软件的内在使用的方法,然后选择合适的统计软件来分析。在研究过程中使用不同的软件,来观察它们是否有差异,这样也有一定的好处,可以帮助我们发现问题。