论文部分内容阅读
统计推断作为现代统计学的基本方法,在统计研究中得到了极为广泛的应用,它既可以用于对总体参数的估计,也可以用作对总体某些分布特征的假设检验。主成分分析方法是一种应用十分广泛的多元统计分析方法,在主成分分析中,往往难以直接导出总体主成分,因此,需要用样本主成分去估计总体主成分,这就涉及到的主成分分析中的统计推断问题。本文运用统计学、 Bayes统计学、抽样技术中的相关知识和理论,旨在进一步总结和完善基于大样本条件下正态分布总体的主成分分析中的统计推断问题。并进一步研究在复杂分布总体(非正态总体)情况下或者小样本情况下试运用Bootstrap方法、Jackknife方法以及基于Bayes思想的调整Bootstrap法进行主成分分析中的统计推断问题的研究,力求对主成分分析中的统计推断问题进行完善和优化。文章首先整理和总结在大样本条件下,总体服从多元正态分布的假设前提下的主成分分析方法中的统计推断,其中包括参数估计与假设检验两部分。参数估计又分为:寻找特征值与特征向量的近似分布、构造特征值的置信区间与特征向量的置信域、构造主成分得分的联合置信区间;假设检验分为:对主成分分析适用性的检验、对特征根的检验、对主成分选取个数的检验等。其次,主要立足于在总体分布复杂的条件下,或对总体分布未知的前提下如何进行主成分分析方法的统计推断进行讨论。先主要尝试运用两种基于原样本的模拟抽样统计推断方法Bootstrap法和Jackknife法对主成分分析中的相关系数矩阵的特征值进行区间估计及其他统计通断问题的讨论,并同时考虑两种方法的优势、估计误差、存在的缺陷等问题,还包括运用Bayes思想对Bootstrap方法进行调整修正,从而将Bayes方法与Bootstrap方法结合来对进行主成分分析中统计推断。最后,是对本文所运用的估计方法进行联系和对比后进行的小结,以及对后续研究的内容的叙述。