Meta分析基础数据研究

被引量 : 5次 | 上传用户:gaoliqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景与目的循证医学以提供最好、最强证据为主要目的,故其研究结果对临床实践和医学研究及决策有及其重要和广泛的影响。在循证医学的研究中,除了极少数系统评价(systematic review)的结果用非量化方式表达外,绝大多数经meta分析(meta-analysis)得出,但meta分析在方法学和应用方面有诸多局限,例如缺乏有效的探测和纠正发表偏倚的方法,没有最小研究数限制,使用的资料类型有限等,由此导致综合效应量的高估和对meta分析结果的错误解释,可能会严重误导临床实践和医学研究及决策,meta分析以及循证医学也就失去了其应用价值,上述meta分析在循证医学研究应用中的种种局限,甚至也一定程度上动摇了meta分析在循证医学研究中的核心地位。2013年12月美国第八届国家联合委员会(JNC8)的2014年成人高血压管理指南中指出,成人高血压管理指南应基于高质量的随机对照试验(Randomized Control Trial)结合专家评分的系统评价方法来制定,而不是基于meta分析结果。我国meta分析的方法学研究在国际仍接近空白。在很多meta分析的方法学研究中,需要当前meta分析的一些先验信息,而这些先验信息目前尚没有系统的研究结果可提供,所以一定程度上制约了meta分析的方法学研究。本研究针对meta分析方法所涉及的若干问题,全面了解meta分析方法的应用现状,剖析meta分析应用中所存在的问题及其带来的潜在风险,并提出解决的思路或可能的途径,为从事meta分析方法学研究及应用的国内外学者提供依据。研究方法文献收集收集所有经注册的meta分析文献,主要来源于Cochran Library的两个数据库,即Cochrane Database of Systematic Reviews(CDSR)和Database of Abstracts of Reviews of Effects (DARE),前者是Cochran Collaboration团队自己的研究产品,后者是其它研究机构的产品。之所以限于Cochran Library数据库,主要考虑的是其文献质量相对较高。文献的入选标准为:语言限于英文和中文,属于meta分析类论著,可获取全文,发表期刊为Medline检索系统收录。数据提取在数据提取前,事先制定数据提取计划,内容包括确定文献纳入提取标准,确定数据提取原则,确定数据提取内容,制定数据提取表格,数据提取培训计划等。数据提取原则主要包括:若文献语言是中文和英文以外的语言,或文献非全文,或没有做meta分析,或发表期刊不在Medline索引,则终止提取;若纳入meta分析文献数为1,则只提取文章标题,发表期刊,和纳入meta分析研究数这些信息,对纳入研究数大于1的文章进行完整的数据提取。森林图部分提取的指标为摘要结果部分出现的第一个指标,如果摘要中没有给出则到文章正文结果部分提取出现的第一个指标,如果第一个出现的指标结果是某一亚组(subgroup)的结果,则提取这个指标的整体合并结果,如果亚组间没有进行合并,则提取第一个纳入文献数多于1的亚组结果。统一招募南方医科大学生物统计学系本科生及选修循证医学的硕士生志愿者,经完整培训后选择熟悉掌握标准流程和提取技术的参与最终的数据提取,志愿者共计150余名。提取时间为2013年7月到2014年3月。数据核查与确认由两个人共同负责,出现不一致时经协商确认。分析内容主要分析内容包括:Meta分析的特征变量,如第一作者国别、发表年份、文章页数、检索数据库、是否有纳入标准、是否限定发表年限、是否限定语言、所限定的语言、是否限定纳入研究类型(设计类型)、纳入研究类型、是否定义主要指标、主要指标个数是否多余3个、是否表述所用到的meta分析软件、meta分析软件类型、是否做发表偏倚检验、发表偏倚检验方法、是否做异质性检验、异质性检验方法、是否做文献质量评价、文献质量评价工具、是否做meta回归、是否做敏感性分析、是否做亚组分析、是否给出森林图、meta分析方法(fixed-random-bayesian三种模型)、纳入meta分析的研究数、阳性研究数(及其占比)、第一组样本量、第二组样本量、总样本量、最小样本量,最大样本量,效应量类型、最小效应量、最大效应量、合并效应量值(含95%CI)、合并P值、τ2、I2、异质性检验P值、结论推荐等级(Grade)、结论的等级(是否肯定)、文章研究类型(RCTs、观察性研究、干预性nonRCT、诊断试验、卫生技术、卫生信息、卫生经济等)等。同时对mea分析存在的典型问题进行详细剖析。统计学处理本研究以描述分析为主。由于特征变量(如样本量、效应量、τ2等)在分布两端的极端值变异非常大,所以均值和标准差的计算均用其1%-99%分位数以内的数据。两组定量变量的比较用Wilcoxon two-sample test,两组定性标量的比较用χ2检验。分层分析考虑的分层因素有:数据库、期刊质量、效应量类型(如OR、RR、MD等)。数据分析采用统计软件SAS9.2。结果文献提取汇总共提取了11655篇做meta分析的文章(CDSR3845篇,DARE7810篇)。只纳入1篇文献做1neta分析的文章共有830篇(CDSR806篇,DARE24篇)。纳入多于1篇文献做meta分析的文章共有10825篇(CDSR3029篇,DARE7786篇)。按照CDSR和DARE两来源数据库分层Meta分析特征变量的分布第一作者国别:文章的第一作者国别有82个国家,居前三位的是英国(21.3%),美国(17.5%)和中国(11.6%)。CDSR居前三位的是英国(34.0%),澳大利亚(12.4%)和加拿大(7.9%)。DARE居前三位的是美国(21.2%),英国(16.3%)和中国(14.5%)。文章页数:文章页数均值为29.9±48.6(x±s),中位数为11.0(8.0-32.5(P25-P75))。CDSR中均值为69.88±64.01(x±s),中位数为51.0(34.0-82.0(P25-P75))。DARE中均值为11.69±22.27(x±s),中位数为9.0(7.0-11.0(P25-P75))。Meta分析要素:97.8%的文章给出了纳入标准,CDSR和DARE中比例分别为99.8%和97.0%。61.3%的文章限定了原始文献的发表年限,CDSR和DARE中比例分别为53.9%和64.2%。20.0%的文章限定了原始文献的语言,CDSR和DARE中比例分别为0.7%和27.5%。90.6%的文章限定了原始文献的研究设计类型,CDSR和DARE中比例分别为99.8%和87.0%。56.4%的文章定义了主次要指标,CDSR和DARE中比例分别为78.4%和46.8%。70.6%的文章给出了用到的meta分析软件,CDSR和DARE中比例分别为56.9%和76.0%。45.5%的文章做了发表偏倚检验,CDSR和DARE中比例分别为40.7%和47.4%。72.7%的文章做了文献质量评价,CDSR和DARE中比例分别为88.9%和66.3%。86.7%的文章做了异质性检验,CDSR和DARE中比例分别为87.9%和86.2%。14.0%的文章做了meta回归,CDSR和DARE中比例分别为4.0%和17.9%。48.3%的文章做了敏感性分析,CDSR和DARE中比例分别为57.0%和45.0%。49.8%的文章做了亚组分析,CDSR和DARE中比例分别为56.3%和47.3%。89.7%的非诊断试验meta分析类型的文章给出了森林图,CDSR和DARE中比例分别为100.0%和85.2%。文献质量评价方法:文献质量评价工具使用较多的有Risk of Bias Table (23.4%), Jadad Scale (17.0%), QUADAS (6.0%), CDSR中使用较多的是Risk of Bias Table (55.3%), Jadad Scale (9.2%). DARE中使用较多的有Jadad Scale (21.0%), QUADAS (8.9%), Risk of Bias Table (6.7%).Meta分析软件:70.6%的文章给出所用到的meta分析统计软件,使用较多的有Revman (57.9%), STATA (20.8%), SAS (4.7%). CDSR中比例为56.9%,使用较多的有Revman (96.2%). DARE中比例为76.0%,使用较多的有Revman (46.7%), STATA (26.8%), SAS (6.1%).发表偏倚检验方法:45.5%的文章做了发表偏倚检验,使用较多的方法有漏斗图法(75.4%), Egger’s Test (29.1%), Begg’s Rank-correlation Test (10.5%). CDSR中比例为40.7%,使用较多的方法有漏斗图(75.4%), Egger’s Test (12.2%). DARE中比例为47.4%,使用较多的方法有漏斗图(73.9%), Egger’s Test (34.8%), Begg’s Rank-correlation Test (13.7%).异质性检验方法:90.4%的做异质性检验文章给出了检验(评价)异质性的统计量,包含I2的比例为72.9%, Q为50.0%,τ2为3.2%。CDSR中比例为97.3%,包含I2的为87.0%, Q为15.0%,τ2为1.1%。DARE中比例为87.7%,包含有I2的为66.7%,Q为65.5%,τ2为4.1%。纳入研究数:纳入meta分析研究数均值为8.90±10.03(x±s),中位数为6.0(3.0-11.0(P25-P75))。纳入1-6篇的比例分别为7.4%,10.3%,10.1%,9.1%,9.0%,7.4%. CDSR中均值为5.70±8.42(x±s),中位数为3.0(2.0-6.0(P25-P75))。纳入1-6篇的比例分别为21.0%,20.2%,13.1%,8.9%,7.2%,5.1%. DARE中均值为10.59±10.40(x±s),中位数为8.0(5.0-13.0(P25-P75))。纳入1-6篇的比例分别为0.3%,5.1%,8.5%,9.2%,9.9%,8.7%。阳性研究数及阳性比例:阳性研究数均值为2.83±4.48(x±s),中位数为2.0(0-3.0(P25-P75)), CDSR中均值为2.15±4.35(x±s),中位数为1.0(0-2.0(P25-P75)), DARE中均值为3.19±4.50(x±s),中位数为2.0(1.0-4.0(P25-P75))。阳性比例均值为0.34±0.30(x±s),中位数为0.27(0-0.50(P25-P75)), CDSR中均值为0.32±0.32(x±s),中位数为0.25(0-0.5(P25-P75)), DARE中均值为0.34±0.30(x±s),中位数为0.29(0-0.53(P25-P75))。合并效应量类型:合并效应量类型共有21种,频数较大的有RR(36.9%),OR(27.8%), MD (20.3%), SMD(5.8%)。CDSR中频数较大的有RR(49.3%),MD(22.2%), OR (19.5%), SMD (5.5%)。DARE中频数较大的有RR(31.2%),OR (31.5%), MD (19.5%), SMD (6.0%)。总样本量:总样本量的均值为3993.66±12389.30(x±s),中位数为853(333.0-2436.0(P25-P75))。CDSR中的均值为2310.92±8404.73(x±s),中位数为509.5(205.0-1419.5(P25-P75))。DARE中的均值为4895.23±13984.90(x±s),中位数为1075.0(445.0-3105.0(P25-P75))。τ2分布:τ2均值为23.40±182.48(x±s),中位数为0.07(0-0.45(P25-P75))。CDSR中均值为18.25±153.60(x±s),中位数为0.05(0-0.31(P25-P75))。DARE中均值为30.33±215.30(x±s),中位数为0.09(0.01-0.80(P25-P75))。I2分布:I2均值为31.29%±32.67%(x±s),中位数为22.0%(0%-60%(P25-P75))。CDSR中均值为27.2%±31.3%(x±s),中位数为12.0%(0%-54%(P25-P75))。DARE中均值为34.6%±33.4%(x±s),中位数为30.0%(0%-65%(P25-P75))。合并效应量检验结果:合并效应量检验为阳性结果的比例是61.7%。CDSR中为55.5%。DARE中为65.9%。异质性检验结果:异质性检验为阳性结果比例是31.0%。CDSR中为23.7%。DARE中为35.8%。Grade分布:约4.5%的非诊断试验类型的meta分析文章给出了合并结果的Grade评价结果,各等级的比例分别为:High20.1%, Moderate37.6%, Low27.5%, Very Low14.8%. CDSR中分别为:17.8%,37.4%,28.9%,15.9%。DARE中分别为:32.9%,38.6%,20.0%,8.6%。结论的等级:结论等级中Grade评价以及语言判断的肯定和不肯定的比例分别为4.6%,60.8%,34.6%. CDSR中分别为12.4%,45.3%,42.3%。DARE中分别为1.1%,67.9%,31.1%。研究类型:研究类型最多的是为RCT(76.9%), CDSR中为99.2%, DARE为68.0%。按照期刊质量分层Meta分析特征变量的分布Meta分析要素(按期刊分层):定义文献纳入标准,ICMJE(国际医学期刊协会)成员期刊的比例为96.9%,非ICMJE成员期刊的比例为97.9%。限定发表年限,ICMJE成员期刊的比例为63.4%,非ICMJE成员期刊的比例为61.2%。限定原始文献语言,ICMJE成员期刊的比例为22.6%,非ICMJE成员期刊的比例为19.8%;限定原始文献研究类型,ICMJE成员期刊的比例为89.8%,非ICMJE成员期刊的比例为90.7%;定义主次要指标,ICMJE成员期刊的比例为51.1%,非ICMJE成员期刊的比例为56.8%;给出用到的meta分析软件,ICMJE成员期刊的比例为73.4%,非ICMJE成员期刊的比例为70.4%;发表偏倚检验,ICMJE成员期刊的比例为50.3%,非ICMJE成员期刊的比例为45.1%;文献质量评价,ICMJE成员期刊的比例为67.2%,非ICMJE成员期刊的比例为73.1%;异质性检验,ICMJE成员期刊的比例为89.7%,非ICMJE成员期刊的比例为86.4%; meta回归,ICMJE成员期刊的比例为24.4%,非ICMJE成员期刊的比例为13.1%;敏感性分析,ICMJE成员期刊的比例为55.1%,非ICMJE成员期刊的比例为47.7%;亚组分析,ICMJE成员期刊的比例为54.3%,非ICMJE成员期刊的比例为49.4%;限定原始文献研究类型(非诊断试验类型文章),ICMJE成员期刊的比例为91.2%,非ICMJE成员期刊的比例为89.6%。纳入研究数(按期刊分层):ICMJE成员期刊中纳入meta分析研究数均值为12.35±12.92(x±s),中位数为9(5.0-14.0(P25-P75))。纳入1-6篇的比例为0.2%,3.5%,6.5%,7.2%,9.0%,7.7%。非ICMJE成员期刊中均值为8.62±9.71(牙±s),中位数为6(3.0-11.0(P25-P75))。纳入1-6篇的比例为8.0%,10.8%,10.3%,9.3%,9.0%,7.4%。总样本量(按期刊分层):ICMJE成员期刊中总样本量的均值为10711.33±23234.18(x±s),中位数为2484.50(831.0-8608.0(P25-P75))。非ICMJE成员期刊中均值为3450.28±10879.62(x±s),中位数为790.00(314.0-2186.0(P25-P75))。合并效应量检验结果(按期刊分层):ICMJE成员期刊中的阳性结果比例为65.9%。非ICMJE成员期刊中的阳性结果比例为61.5%。异质性检验结果(按期刊分层):ICMJE成员期刊中的异质性检验阳性结果比例为35.1%。非ICMJE成员期刊中的阳性结果比例为30.7%。按照效应量类型分层Meta分析特征变量的分布纳入研究数(按效应量类型分层):效应量为RR的文章中纳入meta分析研究数均值为8.29±8.76(x±s),中位数为6(3.0-10.0(P25-P75))。效应量为OR的均值为9.34±9.12(x±s),中位数为7(4.0-11.0(P25-P75))。效应量为MD的均值为8.57±9.40(x±s),中位数为5(3.0-10.0(P25-P75))。效应量为SMD的均值为9.97±11.14(x±s),中位数为6(4.0-12.0(P25-P75))。总样本量(按效应量类型分层):效应量为RR的文章中总样本量的均值为4694.13±13798.86(x±s),中位数为955(382.0-2862.0(P25-P75))。效应量为OR的均值为5345.49±14295.29(x±s),中位数为1294(504.5-3666.0(P25-P75))。效应量为MD的均值为1517.54±6690.50(x±s),中位数为423(183.0-997.0(P25-P75))。效应量为SMD的均值为1186.08±4325.50(x±s),中位数为413.5(206.0-936.0(P25-P75))。合并效应量(按效应量类型分层):效应量为RR的文章中合并效应量均值为1.09±0.78(x±s),中位数为0.90(0.66-1.24(P25-P75))。效应量为OR的均值为1.41±1.60(x±s),中位数为0.95(0.61-1.52(P25-P75))。效应量为MD的均值为-0.80±15.49(x±s),中位数为±0.06(-2.00-0.85(P25-P75))。效应量为SMD的均值为-0.05±0.64(x±s),中位数为-0.10(-0.45-0.35(P25-P75))。变量间的相关关系(1)纳入研究数阳性篇数等与合并效应量结果阴阳性的关系:阳性结果文章的纳入研究数多于阴性结果文章(6.826±6.384VS.9.521±10.187,Z=-15.222,P=0.000)。阳性结果文章的阳性研究数多于阴性结果文章(0.878±1.833VS.3.784±5.092,Z=-46.512,P=0.000)。阳性结果文章的阳性研究数比例大于阴性结果文章(0.130±0.200VS.0.450±0.300,Z=-46.138,P=0.000)。阳性结果文章的总样本量大于阴性结果文章(Z=-6.493,P=0.000)。(2)纳入研究数与异质性检验结果的关系:异质性检验结果为阴性和阳性两组的纳入研究数有统计学差异(7.000±6.609VS.11.861±12.306,Z=23.575,P=0.000),有异质性文章的纳入研究数多于无异质性文章。(3)纳入研究数与结论等级的关系:结论肯定的文章的纳入研究数多于结论不肯定的文章(8.305±8.542VS.9.663±10.213,Z=-9.216,P=0.000),纳入研究数多的更有可能得到肯定的结论。Meta分析文献中发现的典型问题在所分析的文献中发现的主要问题有:-不同研究类型间的合并;-不同效应量类型间的合并;-森林图中合并效应量类型与文中不一致;-特异度的95%CI上限大于1;-摘要或者正文中文字表述的结果与对应的森林图不一致。结论本研究发现目前meta分析的文章主要存在以下问题:纳入研究数偏少;文献质量评价缺失比例较大,且不够严谨;未进行异质性检验和发表偏倚检验的比例较大;不同研究类型或不同效应量类型合并有可能带来结论的误导;文章质量偏低或样本量过小导致得不到比较确定的结论等。由于上述情况的存在,助长了meta分析的滥用倾向meta分析不规范等问题。今后研究者应注意并克服这些问题,纳入较高质量的文献,严格执行科学规范的操作,谨慎应用meta分析,规范完整表述研究过程及结果,才能得到真正有意义的研究结论,才能真正体现meta分析提供最好证据的价值。本研究所获取的meta分析研究的基础数据,尤其是meta分析特征变量的分布特征,为将来meta分析的方法学研究提供了丰富的先验信息。
其他文献
如何推进分类招考成为高职院校招生主渠道,成为迫在眉睫的问题。近年来,各地积极推行高职院校分类考试招生工作,探索了多种模式,开展了各种改革试验。这些试验概括而言有5个
借鉴美国先修课程项目的经验,以浙江省高校参与普通高中大学先修课程建设情况为例,从开设类别、授课内容、授课方式及质量监控四方面,分析大学先修课程的建设、管理及质量评
研究背景及目的:本篇论文主要包括两部分内容。第一部分为新生儿筛查试剂的研制,包括新生儿17α-羟孕酮定量测定试剂(时间分辨免疫荧光法)和新生儿总半乳糖定量测定试剂(荧光
<正>张之洞(1837-1909),洋务派代表人物之一,与曾国藩、李鸿章和左宗棠并称晚清"四大名臣",一度是清流派健将。1903年,他回到湖广,重新担任总督。在风风火火筹办新军的同时,
社会保障是维护社会公平正义的基本手段之一。逐步建立以权利公平、机会公平、规则公平为主要内容的社会公平保障体系是建设中国特色社会主义的现实需要。本论文梳理了改革开
发展绿色生态农业,建设新型生态农庄,推进农业可持续发展进程。本文从扬州市福临科技生态农庄采集土壤样品,测定了As、Cd、Cr、Cu、Pb和Zn六种土壤重金属含量,通过GIS和地统
被誉为黑人女性文学之母的佐拉·尼尔·赫斯顿是二十世纪美国文学重要的黑人女性作家之一,她是一位小说家、人类学家、民俗学家,也是哈莱姆文艺复兴时期的活跃分子。赫斯顿她
目的细节护理对减少妇科腹腔镜手术并发症的影响。方法将在2017年3月至2017年8月入住我院并经医师确诊为妇科疾病需要做腹腔镜手术的62例妇科女性患者作为本次研究的对象。62
利用波长1060nm的Nd:YAG激光焊接机对6542高速钢(W6Mo5Cr4V2)和65Mn弹簧钢进行激光拼接试验,以焊后接头表面缺陷为研究对象,针对接头出现的三大主要缺陷提出相应理论对策,以为后
目的:观察白拟滋阴润肺方对食管癌放射性肺炎治疗干预的临床研究。方法:选取本科调强放疗的食管癌患者共30例,随机分为2组,中药试验组采用调强放疗联合滋阴润肺方治疗,对照组仅