临床试验中非独立多终点疗效评价的多重性问题研究及其应用

来源 :第四军医大学 | 被引量 : 0次 | 上传用户:zhaohaojed
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医药研究的不断发展,多重性现象已经渗透了临床试验方案设计和统计分析的方方面面,例如,多次访视和测量、多组比较、多终点评价、期中分析、亚组分析等。可以说在临床试验的整个过程中,多重性问题几乎无所不在,这其中,多终点评价所带来的多重检验问题又是最为关注的问题之一。  虽然ICHE9建议主要终点最好只设一个,但是在很多的治疗领域里一个主要终点很难满足试验的主要目的,因而在评价疗效时就选择哪一个指标为主要终点常有争议,通常需要通过多终点评价来解决。虽然多终点较单个终点在临床试验评价中体现出更多的优势,其随之而来的一系列统计学问题却不容忽视。当要求至少一个主要终点显示出在事先给定的检验水准下的统计学差异时即可认为试验结果阳性时,如果不考虑对多重检验进行校正会增加整个试验的假阳性率。关于多重检验的校正方法已有很多,但由于多终点临床试验数据来自同一受试人群,多个终点间一般不独立,如何根据终点间的相关性适度校正,既能很好的控制总I类错误率又能保持较高的检验效能,仍是一个很棘手的问题。目前针对这方面的研究较少,已有文献中介绍的方法多因其可操作性不好难以应用到实际中。由于临床试验自身特性决定了非独立多终点的普遍性,如何适度校正非独立多终点临床试验以及在该试验背景下的相关应用还有待深入探讨。  本文拟从多终点间相关性入手,探讨控制总I类错误率的方法,并应用于多终点的样本量估计以及纵向数据的多重检验(如两阶段适应性设计等)校正中,具体研究内容与结果如下:  1、多终点间的相关性  以两个终点的疗效评价为例分析了横向数据中的多重检验可能存在的相关性。模拟研究显示,当多终点来自同一个评价体系(例如某量表评分)时,终点间的相关性是有规律可循的,例如当两个终点分别为由某量表评分转化而来的痊愈率和有效率时,在不同的病情分布下终点间相关性均不高,此时采用Bonferroni校正即可;当多终点分别来自不同的评价体系(例如两个不同的实验室检查指标)时,终点间的相关性较原始指标有不同程度的减弱。了解终点间相关性的变化规律有助于在试验设计时为方案中关于多终点校正的规定提供参考依据。  以单个终点(定量指标)的两阶段设计为例分析了纵向数据中的多重检验可能存在的相关性。模拟研究显示,在采用数据合并分析法的两阶段设计中,两次检验的相关性γ12可间接地由统计量的相关性来估计,γ12随着第一阶段样本量占总样本量的比例λ增大而增大,该变化趋势不受组间差值大小、数据变异度和样本量的影响,本文拟合出了计算公式γ12=(?λ),为?两阶段适应性设计中总I类错误率的控制提供相关性的参考依据。  2非独立多终点的统计推断  针对基于P值校正的方法,分别在两个终点、三个终点(等相关和混合相关结构)不同情形下进行模拟比较,研究结果显示,当终点间弱相关时采用较为简单的Bonferroni或Sidák法即可,中高强度相关时推荐James法。本文提出一种结合因子分析的多元思想并基于Sidák校正公式改进的校正方法,简称FR法。该方法的校正原理是通过对k个非独立多终点进行不降维因子提取,并基于正交旋转后的因子载荷寻找合适的权重w,使得κ校正值等于1-(1-α)1kw。  模拟研究分别考察了FR法、James法和Hochberg法对于非独立的连续型和两分类多终点在控制总I类错误率和总检验效能方面的表现,结果显示FR法是校正非独立多终点的有效方法。该方法的优点是:①同等对待全部多终点,不受主观因素影响;②充分考虑了终点间的相关结构,很好的控制了总I类错误率,且保证足够的检验效能;③基于边际检验,不受终点分布影响,可根据需要计算校正后的P值或α值,其中α校正值可用于可信区间CI的校正,适用于非劣效设计的多终点试验;④校正公式不分单双侧检验,公式简洁,不依赖计算机辅助。  3非独立多终点的样本量估计  当至少一个主要终点显示出在事先给定的检验水准下的统计学差异即可认为试验成功时,本文提出了以总检验效能DP不低于预期值为前提根据终点间相关性适当调整样本量以节约研究资源的样本量估计和调整策略。在该策略中,按最大值法估计样本量后在保证检验效能不低于预期值的前提下逐渐下调,通过ROC曲线分析寻找样本量调整过程中的利益风险比最佳拐点,即ROC曲线上离左上角距离最近的点,其对应的样本量即为理想样本量。基于该策略,以两个终点为例,比较了基于FR法和Pocock真值校正法的样本量调整结果,研究显示FR法同样适用于非独立多终点的样本量估计。  4适应性设计中的多终点问题  文中结合横向数据中多终点评价的FR校正公式和纵向数据中相关性估计公式γ12=(?λ),进一步应用到采用数据合并分析法的单个指标(定量)两阶段适应性设计中,推导了FR系列函数,其中包括各阶段检验水准校正函数αFR(λ)和总检验效能函数f(λ,α0)。模拟研究显示,FR函数法很好的控制了两阶段试验的总I类错误率。  提出采用FR函数法的两阶段适应性调整策略,在该策略中,首先基于第一阶段总体参数再估计值(按方案规定)计算单阶段试验的计划样本量,基于αFR(λ)函数校正各阶段检验水准,基于f(λ,α0)函数动态计算检验效能,然后通过一个“确定单阶段检验水准→计算总检验效能→调整样本量→确定单阶段检验水准”的循环迭代直至总检验效能达到预期值的过程在第一阶段分析时对整个试验做适应性调整。研究结果显示,FR函数法保证了两阶段适应性设计的灵活性、正确性和完整性。  另外本文还探讨了多个指标试验设计中的适应性调整问题,分别提出了多个指标在单阶段或两阶段设计中的盲态下调整策略,以及在两阶段揭盲下的调整策略,并讨论了其可行性。  本文的主要创新点有:①提出采用数据合并分析法的两阶段设计中两次检验的相关性12r的估计方法和公式;②提出一种结合因子分析的多元思想并基于Sidák校正公式改进的校正非独立多终点的FR法;③提出采用FR法校正的分离检验效能DP计算公式,并给出基于ROC曲线分析的样本量估计和调整策略;④提出一种基于FR函数法的两阶段适应性调整策略。  本文主要是基于多终点间的相关性,探讨了与之相关的一系列问题的解决办法,FR校正法的提出或许能为多终点试验在控制总I类错误膨胀提供多一种选择,并为适应性设计提供一条新的调整思路。
其他文献
党的十八大以来,社会主义核心价值观教育在高校学生日常思想政治教育中占据重要地位。寝室作为大学生学习生活等诸多活动的主场所,其人际关系状况关乎学生个人发展和社会的进步
近日,不少小学从自身的特色课程和学生需求出发,让原本“一刀切”的40分钟课堂,有了不少更符合教育规律、更为人性化的伸缩变化。比较多的一种做法,是将原来的每节课40分钟,
建设基层服务型党组织是践行群众路线的重要内容。根据党的十八大和中共中央办公厅《关于加强基层服务型党组织建设的意见》精神,笔者结合大连海洋大学的工作实践,从机制建设入
期刊
一、中小学体育与美育融合的意义19世纪末,现代奥林匹克运动登上历史舞台,顾拜旦起草国际奥委会章程,阐述了奥林匹克运动的哲学基础、教育和美学意义,奠定了奥林匹克运动的理
近年来学界对政治民主化的讨论很热烈,许多学者都发表总记得观点。那么,综合来说中国政治民主化的主要路径有:自上而下、自下而上、增量民主等。而哪种路径适合中国的发展,我们不
一我国油用亚麻品种工作现状在世界上,油用亚麻主要栽培在美国、苏联、中国、印度、阿根廷、加拿大等国的山区及半山区。1940年不完全统计总播种面积约为8600余万亩,以后并
桂西地区的耕作制度,稻田绝大部分为单季中稻,其中少数冬种小麦、荞麦及豌豆等;旱地利用率较水田为高,一般以玉米为主,间种套种豆类或杂粮。解放后,随着生产的发展和人民生
各地生产实踐和試驗研究証明,合理的灌溉和排水足棉花获得稳定高产的主要措施之一,据淮北棉花試驗站1959年的对比試驗,灌溉的亩产籽棉四百七十九点三至六百四十一点七斤,比不
期刊