缺失数据的估计与应用

被引量 : 13次 | 上传用户：qq547761894

【摘要】

：

在人口普查、环境监测及医学科学纵向研究等大型资料分析中，经常遇到数据缺失问题，它给数据分析与应用带来很多困难。许多的分析模型和统计方法都要求数据完全(complete-data)，

【作者】

：

冯志兰

【发表日期】

：

2003年01期

【关键词】

：

缺失数据单一估计多重估算软件应用

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在人口普查、环境监测及医学科学纵向研究等大型资料分析中，经常遇到数据缺失问题，它给数据分析与应用带来很多困难。许多的分析模型和统计方法都要求数据完全(complete-data)，即对所要分析的每个变量，其每条记录中变量值不能有缺失，如随机区组、重复测量设计以及大型数据回归分析。若某单元数据有缺失，资料将无法进行分析。传统的数据处理中，常把变量中含有缺失的记录列举删除(list-wise deletion)，这样所得结果不仅是建立在非完全数据基础上的分析，而且会损失原有资料的部分信息，有可能造成因有效分析数据集样本例数减小，检验效能随缺失比例增加而降低，同时也可因原始记录中有意义的部分被排除在外，导致分析结果偏性加大，甚至得出错误的结论。本文通过对传统缺失数据处理的列举删除、配对删除、权重估计及单一估计等方法的回顾与对比，着重讨论了单一估计五种方法(均值估计、随机抽取估计、线性回归法、函数估计法及微分残差项法)的基本原理，阐明缺失数据处理中不同方法的适用场合。认为用传统的缺失数据处理方法，忽略了缺失数据的不确定性，应用中有许多缺陷与不足。结合国内外近10年的研究进展，详细阐述了缺失数据多重估算MI(multiple imputation)的基本原理。将数据缺失方式划分为随机缺失，非随机缺失与完全随机缺失，这对于合理编写缺失数据推估程序，正确选用估算方法有很重要的意义。文中对Bayesian基本理论、马尔可夫链蒙特卡罗方法及数据增广算法在缺失数据分析中的应用作了详细的论述。以北京高血压联盟研究所2000-2002年关于波依定治疗高血压病HOT方案研究为实例，对临床试验数据进行了缺失数据的多重估算分析。选取部分数据作为完全数据集，由此模拟随机缺失建立的缺失数据集，用NORM软件推估缺失值建立的NORM MI数据集和用SAS MI推估缺失值建立的SAS 山厄写医科大学币页士学位论文含矢失笙欠据的估计与应用MI数据集，用SAS中的MIXED过程，编程运行，将结果进行对比与分析。为更充分准确地利用缺失数据资料信息，拓宽缺失数据多重估算在医学研究中的应用，提供理论依据。本文主要的结论有:1.缺失数据的传统估算方法虽简单易行，但山于未考虑缺失值的不确定性、加大抽样误差、扭曲样本分布等，无法真实地反映研究事物的特征。2.缺失数据多重估算是目前最为系统和完善的一种方法。随着计算机技术的发展，用于多重估算的软件包很多，应用较为方便。3.实际资料分析证实，对缺失数据进行多重估算，比不进行任何补救措施所获结果更接近于完全数据集。在目前现代统计资料分析中，缺失数据的多重估算具有实际意义，是一种值得推广的统计分析技术。

其他文献

中国梦视阈下构建中国特色哲学社会科学研究

中国梦的提出为构建中国特色哲学社会科学提出了阐述的使命、实现的使命、传播的使命。中国梦内蕴着共同体价值，要求发挥哲学社会科学的功能，为其共同体价值实现奠定基础。为此

期刊

中国梦中国特色哲学社会科学学科体系学术生态话语权

企业并购财务风险及其防范研究

当前,我国社会经济正处于不断推进发展的阶段,加之国有企业深化改革,随着市场经济体制的完善,企业之间的并购活动越来越多,越来越频繁。但是,企业并购理论与实务的研究我国与

学位

企业并购财务风险中国平安并购案

浙江省分级诊疗问题与对策研究

研究目的本研究通过对浙江省新医改以来的分级诊疗情况进行分析,并结合访谈的定性数据对分级诊疗的现状、存在的问题以及发展对策等进行讨论,最终提出有利于浙江省改善医疗服

学位

浙江省分级诊疗医疗资源配置医疗服务供给

云南省茶叶出口竞争力的分析

自古以来,茶产业就是云南省的传统优势产业,是推动云南农业经济飞速发展的支柱型产业,是山区茶农脱贫致富的重要产业。入世以来,云南省茶产业的外贸出口取得了突飞猛进的发展

学位

云南省茶叶出口竞争力影响因素对策

菠萝蜜的组织培养和植株再生

1植物名称菠萝蜜（Artocarpus heterophyllus Lam．），又称树菠萝、木菠萝。2材料类别顶芽和腋芽。3培养条件（1）外植体接种培养基：MS＋6-BA1．5mg．L^-1（单位下同）＋KT0．5＋30g.L^-1蔗糖；（2）启动培养基：M

期刊

植株再生组织培养不定芽增殖

高校教学秘书沟通艺术初探

高校教学秘书肩负管理与服务的双重使命,其身份语言具有多变性和复杂性的特点,在工作过程中需要讲究一些沟通的技巧。本文从模糊语言的语用技巧、工作场所中交际语境关系顺应

期刊

教学秘书沟通艺术模糊语语境关系顺应态势语

高尿酸血症与小于胎龄儿发生的相关性

目的探讨高尿酸血症是否是小于胎龄儿发生的危险因素。方法选取2014年1月—2019年3月在我院产科住院生产的产妇8046例,根据是否分娩了小于胎龄儿分为小于胎龄儿组(639例)和非

期刊

婴儿小于胎龄危险因素高尿酸血症

己内酰胺生产工艺方法综述

己内酰胺是重要的化工工业原料,目前生产己内酰胺主要采用甲苯法和苯法,甲苯法可以直接生成己内酰胺;苯法需要先制备中间体环己酮肟,然后通过贝克曼重排反应生成己内酰胺。从

期刊

己内酰胺环己酮肟贝克曼重排反应

提升我国制药企业竞争优势策略研究

历史的车轮已经步入了21世纪。中国的成功入世以及国内改革步伐的加快，为中国企业的发展提供了难得的历史机遇，但同时也把中国企业内在深层次的问题一一予以暴露，加速了国内企业

学位

竞争优势国家竞争优势产业竞争优势企业核心竞争力“仿创结合”

论我国刑法中的自首制度

自首制度在我国刑法中是一项非常重要的刑罚裁量制度，是刑罚制度的重要组成部分。本文从不同的角度对我国刑法中的自首制度进行论述。全文共分四个部分。第一部分：自首制度概述

学位

自首制度一般自首如实供述自动投案免除处罚刑罚裁量余罪成立要件刑罚制度犯罪分子

缺失数据的估计与应用

其他学术论文