论文部分内容阅读
线性模型是数理统计学中发展较早、理论丰富而且应用性很强的一个重要分支.过去的百余年中,线性模型不仅在理论研究方面甚为活跃,获得了长足发展,而且在工农业、气象地质、经济管理、医药卫生、教育心理学等领域的应用也日渐广泛.作为线性模型前沿科学研究的一部分,污染线性模型由于它在实际生活中的广泛存在性,越来越受到人们的关注,具有很高的应用价值.污染数据与截断数据不同,除了具有不同的提出背景和表现形式之外,它们还是一组不完备的数据.关于污染数据的统计分析,很久以前就开始引起科学家们的关注.早在20世纪60年代,统计学家Huber就已经研究了基于高斯分布下污染数据的极大似然估计.所谓的"污染"模型即为观察值分布未知或至少部分未知的模型,而且它是由于污染源的干扰所致,而这种污染源是有别于模型本身,通过观察污染数据得到的(这些数据假设分布已知).统计分析的目的主要是估计污染系数和模型中的其它参数.近些年,在此领域已颇有成就.污染数据线性回归模型在医学、现代分子学、气象预报等领域有着广泛的应用。
本文对污染数据线性回归模型在区间数据下的参数估计进行了研究.污染模型主要有以下两种:第Ⅰ类污染模型,yi*=(1-v)yi+vti,v为污染参数;第(Ⅱ)类污染模型,Fy*j(y)=(1-v)Fyj(y)+vFij(y),v为污染参数.在区间数据下,我们主要利用无偏转换的方法对数据进行处理.第Ⅰ类污染模型的参数估计主要用最小二乘法,并在一定条件下给出了参数估计的强相合性证明。第Ⅱ类污染模型,主要采用矩估计的方法来处理,并给出了参数估计的结果。
本文提出的方法,可以较好的解决污染数据区间截断下线性回归模型的参数估计问题。
由于数据在污染情况下所包含的信息已经受到损失,再加之在区间删失情况下,信息的损失更加严重.本文在这种情况下给出的结果仍然有着较好的性质。
在最后一章,进行了模拟计算。通过模拟计算的结果可以看出,虽然数据受到了污染和区间删失的双重信息损失,根据本文的方法仍然可以获得较为满意的结果。