论文部分内容阅读
本文主要研究复杂时间序列的未知周期、变点、趋势、协变量效应等的估计问题,研究的复杂时间序列包括存在复杂协变量效应的时间序列、存在变化周期结构的时间序列以及非平稳的函数型时间序列等。周期性和趋势性是时间序列的重要特征,许多时间序列都表现出很强的周期性和趋势性。经典的时间序列分解模型是将时间序列分解成趋势项、周期项和误差项三部分,其中周期是已知的。但是实际问题中许多时间序列的周期值可能是未知的,如经济周期、全球年均气温周期等,此时,一个准确的周期估计量对于进一步的估计、预测或假设检验至关重要。因此,未知周期的估计具有重要的现实意义。与此同时,许多时间序列受到其他协变量的影响,而且不同的协变量对时间序列的影响机制可能不相同,比如某些协变量的影响会随着时间改变,所以可能需要利用变系数模型拟合这些变量;某些协变量可能是函数型数据,比如每天的温度变化曲线可能会影响每日的流感患病人数,如果简单地将每日平均气温作为协变量,可能会得出错误的结论,因为平均值相同的气温可能具有完全不同的分布,所以可能需要利用函数型模型。因此,在经典的时间序列分解模型中加入灵活的半参数模型比如变系数模型、可加模型、单指标模型、函数型模型等可以使我们的模型更具有普适性。论文第2章研究了包含未知周期分量和复杂协变量效应的时间序列。将部分函数型部分线性变系数单指标模型与经典的时间序列分解模型结合起来,来处理复杂的数据结构和协变量效应,然后使用两阶段估计过程来估计未知周期分量和协变量函数。在第一阶段,应用惩罚最小二乘法来估计周期分量中的未知周期,我们没有忽略未知的协变量效应,而是利用B-样条逼近它们;在第二阶段,给定周期估计,使用B-样条估计周期序列、变系数函数、单指标连接函数和函数型斜率函数。本章推导了所提出估计量的渐近性质如周期估计的相合性以及协变量函数估计的收敛速度和渐近正态性。蒙特卡洛模拟展现了本章方法具有良好的有限样本表现,即使在样本量较小的情况下也能为未知周期提供较好的估计。两个实际数据:肺结核和流感与空气污染数据集的应用展现了该方法的实用性,我们的方法不仅揭示了与现有发现一致的数据特征,还揭示了一些新颖有趣的数据特征,这有助于帮助我们更好地理解和解释该数据集及其潜在影响机制。此外,某些时间序列时间跨度较长,周期序列的振幅或结构可能会因为某些特殊事件而改变,比如金融危机前后某些经济金融领域的相关时间序列。忽略周期结构的变化或者周期序列的变点,会导致周期序列的估计出现较大偏差,从而影响进一步的检验或者预测效果,所以研究周期序列中的变点的估计也具有重大现实意义。因此,论文第3章研究了存在趋势和协变量效应项以及未知变化周期结构的时间序列。提出了一种三步估计程序来准确估计模型中的未知周期、变点、周期分量、趋势和可加协变量效应函数。第一步,我们采用惩罚分段最小二乘估计方法来估计周期序列的未知周期;第二步,给定周期估计,我们构造SupF检验结合野生二分法(WBS)来估计周期分量中的变点;第三步,给定周期估计和变点估计,利用B-样条估计周期序列、趋势函数和可加协变量函数。本章推导了所提出估计量的渐近性质,包括周期估计和变点估计的相合性以及函数估计的渐近性质。该方法的优越性和实用性通过模拟研究和对一些实际数据的应用如全球气温变化数据、北极海冰范围数据、Mauna LOA的二氧化碳(CO2)变化数据和全球COVID-19确诊病例数据等得到证明。近年来关于函数型数据的研究广泛发展,但是处理具有时间相关性的函数型时间序列(FTS)的文献相对较少。而且大部分对于函数型时间序列的研究主要集中在平稳的函数型时间序列,但是社会生活中许多函数型时间序列都是非平稳的,这种非平稳性可能是由函数型数据结构改变、确定性趋势分量或周期性引起的。对于函数型趋势、周期的估计的文献十分稀少,且主要停留在检验其周期和趋势的存在性的问题上,但是函数型趋势、周期等的估计问题对于函数型时间序列的研究同样重要。因此,在论文第4章,我们首次研究了具有未知函数型周期和函数型趋势的非平稳函数型时间序列,提出了一种惩罚最小二乘估计方法来获得对未知周期、周期分量以及趋势函数的准确估计,其中的未知函数由张量B-样条近似。我们还推导出了得到的估计量的渐近理论,模拟研究和三个真实数据如香港地区的每日一氧化碳(CO)和氮氧化物(NOX)曲线以及每年的全球气温异常变化曲线数据的应用说明了我们方法的优越性和实用性。