论文部分内容阅读
Gamma分布常用于概率统计模型,它在水文学和气象学、可靠性和生存分析等领域都有广泛的应用。因此,对Gamma分布特别是Gamma分布的参数估计展开研究有着重要意义。本文对现有的Gamma分布的性质和参数估计方法进行总结,并且提出一种新的参数估计方法——参数分离法,最后用MATLAB进行数值模拟,计算三种估计的估计值和均方误差,并在均方误差的准则下,比较这三种估计方法的优劣。对于回归,一直以来研究最多的是多元线性回归模型,但在许多实际问题中,响应变量及其期望并不都满足其假定条件,因此常常应用其直接推广的模型,即广义线性模型。其中Gamma回归模型以及Gamma分布好其它指数族分布的混合模型有着广泛的应用,因此本文对Gamma回归展开深入的研究。本文介绍了 Gamma回归模型的定义及参数估计,并用两种不同的方法对估计值进行求解,同时证明两种方法的等价性,最后通过具体实例进行分析。当对一组观测值进行回归建模时,数据集中可能存在异常点或者强影响点,可能导致建立的回归模型与实际不相吻合,或者得到错误的结论,因此识别数据集中的异常点或强影响点是数据分析的一个重要任务。统计诊断是数据分析的重要组成部分,其主要任务就是检测得到的观测数据是否满足给定的假设条件和既定模型(postulated model),并通过计算和比较诊断统计量的值,找出不满足条件的数据点,即异常点或强影响点。本文介绍了最基本的统计诊断模型——数据删除模型(Case-Deletion Model,并简记为CDM)。本文首先给出Gamma回归模型的数据删除模型的定义,并对数据删除模型的回归系数进行估计,求解出回归系数的一阶近似公式;其次介绍几种统计诊断量,如拟合偏差、Cook距离和似然函数等,并给出这几种诊断统计量的计算公式或一阶近似公式;最后用具体实例进行分析,计算各种诊断统计量的值,并通过比较,找出异常点或者强影响点。