新型多元校正、校正转换和多元分类分析方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:cc249879369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代化工过程和化工产品质量涉及多方面因素和指标,通过这些因素和指标的测定数据来关联化工过程和化工产品质量,对优化整个化工过程和产品质量具有重要意义。由于系统往往非常复杂,这些因素和指标往往具有相关性,测定数据混有噪音或干扰。因此从大量复杂数据中提取有用信息、滤除噪音,建立稳健的数学模型,可获得对于生产过程更好的理解,实现对产品质量进行在线控制。本文选择广泛用于质量在线控制过程的近红外光谱系统为研究对象,研究并提出了几种化学计量学方法,涉及信号处理、噪音滤除、稳健模型建立、仪器漂移校正等方面。本论文首先考察两种纯净分析信号或处理(Net Analyte Signal/Processing, NAS/NAP)算法、两种正交信号校正(Orthogonal Signal Correction, OSC)算法,研究了它们之间及其与PLS多元校正之间的关系。实验数据和模拟光谱数据处理结果表明,在一般情况下,这些信号处理方法处理光谱后得到的多元校正模型的预测结果相似;但在光谱中的噪声和不同组分之间存在重叠的条件下,根据其结果可将这些方法分成两组:应用Lorber NAP算法建模与应用FearnOSC算法建模获得相同的预测结果;而应用Olivieri NAP算法建模与应用修改后的Fearn OSC算法建模获得相同的预测结果。这四种信号处理方法仅能简化PLS模型,而不能提高PLS模型的预测效果。因此,本论文开发了新型分段NAP信号处理方法--Piecewise NAP (PNAP),通过局部地去除光谱中与目标分析物不相关的干扰或噪声,从而提高在近红外光谱上建立的多元校正模型的预测效果。与常用的OSC或NAP信号处理方法相比,即使光谱中包含噪声或不同组份之间存在重叠,PNAP算法模型的预测结果比常规NAP和OSC模型更稳健。与Olivieri的NAP和改良Fearn的OSC一样,对Olivieri的NAP和改良Fearn的OSC进行分段处理(Piecewise),其多元校正模型具有相同的预测结果。基于模型融合思想,本文开发了叠加偏最小二乘回归(Stacked Partial Least-Squares, SPLS)和叠加移动窗口偏最小二乘回归(Stacked Moving-Window Partial Least-Squares, SMWPLS)两种新型多元校正方法,它们通过给予大小不同的权重因子来去除光谱中的局部冗余信息。其基本原理是在所有的光谱间隔上建立平行的常规偏最小二乘回归(PLS)模型,充分利用整个光谱数据中的信息,并且通过赋予光谱数据中与目标分析物高度相关光谱间隔较大的权重,对这些子PLS模型进行融合。理论和实验结果表明这两种叠加算法效果显著优于传统的PLS模型。这两种叠加算法可以获得更简化的回归模型。当目标分析物的信息不是均匀地分布或仅集中在一个光谱间隔上时,与在整个光谱或一个最好的光谱区间内建立的PLS模型相比,叠加模型可以获得更好的预测效果。另外,应用这两种叠加算法不仅可以提高多元校正模型的预测效果,而且对于光谱中包含离群点(Outlier)的数据具有潜在的处理能力。本文研究同样显示新开发的叠加融合方法(SPLS)具有保持多元校正模型的能力,可将某分析仪器建立的校正模型用于另一分析仪器的分析预测上。与传统的校正转移方法需要在两个分析仪器上都进行转换标准样本检测不同,SPLS算法不需要测量转换标准样本,就可在两个不同仪器的光谱数据上都可以获得稳健预测效果,并保持良好的模型预测能力。通过湖中沉积物的近红外光谱数据,展示SPLS对不同仪器上样本的预测效果。SPLS通过减小不同仪器上的局部光谱差异的影响,从而有助于常用的校正转换技术提高转换后模型的预测效果。当在频率空间中进行校正转换时,基于数据或模型融合思想的双域回归分析(Dual Domain Regression Analysis, DDRA)方法同样有助于提高常规的校正转换模型的预测效果。在不同的空间中(时域和频域)进行模型融合都可以提高校正转换后的模型的预测效果,而本文新开发的SPLS与常用的校正转换方法相结合优于利用双域回归(DDRA)模型融合的校正转换方法。与回归中一样,对分类器进行融合或叠加,去除光谱中局部的冗余信号,相对于任何一个单独的分类器,可以获得更精确的分类结果。本文开发了两种新的叠加分类器法,包含一个基于新设计SPLS的叠加偏最小二乘分类分析方法(Stacked Partial Least-Squares Discriminant Analysis, SPLSDA)和另一个对一系列线性分类器进行叠加的叠加线性分类分析方法(Stacked Linear Discriminant Analysis, SLDA)。与偏最小二乘分类分析(Partial Least-Squares Discriminant Analysis, PLSDA)和线性分类分析(Linear Discriminant Analysis,LDA)分类器的分类结果相比,应用SPLSDA和SLDA可获得更好的分类结果。SPLSDA分类器通过对在不同的光谱间隔上建立的子PLSDA分类器进行叠加融合,从而揭示光谱中的每个光谱间隔对最终分类结果的贡献,并且SPLSDA一般比在整个光谱上建立的PLSDA分类器需要更少的潜在变量,SPLSDA和SLDA分类器使用不同的权重进行变量选择,同时弥补了在常规的变量选择方法中可能发生的信息遗漏缺陷。本论文还研究了利用小波正交信号校正(Wavelet Orthogonal Signal Correction, WOSC)去除频率空间中的不相关信息,从而获得稳健的分类器。这个新的分类方法将Wavelet Prism(具有局部的和多频率组分的特点)与正交信号校正(整体地去除不相关的信息)相结合,从而极大地提高分类器的分类效果,同时简化了分类器。本文的研究显示小波正交信号处理分类分析(Wavelet Orthogonal Signal Correction Discriminant Analysis, WOSCDA)分类器可以有效地去除光谱中与分类不相关的信息,与在整个时域上进行OSC处理的PLSDA分类器(Orthogonal Partial Least-Squares Discriminant Analysis, OPLSDA)相比,WOSCDA分类器的效果更好。
其他文献
企业内部控制自我评估,是指由公司董事会和管理层组织内部机构实施的,对公司内部控制有效性进行评估,形成评估结论,出具评估报告的过程。内部控制有效性是指公司建立与实施内
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
行政不作为是相对于行政作为而言的行政行为。行政不作为违法同样会给公民、法人及其他组织的合法权益造成损害。原有的《国家赔偿法》已不能适应当前的发展需要,通过与法制
目的:研究维生素A(VA)缺乏对3 w龄大鼠的脂质过氧化和抗氧化系统的影响.方法:健康Wistar雄性大鼠33只,按体重随机分为A(VA完全缺乏组),B(VA轻度缺乏组),C(VA正常对照组)三组.
目的:研究铁皮石斛主产区F型和H型居群rDNA ITS碱基序列的差异.方法:运用PCR直接测序法对广西、贵州、云南铁皮石斛主要居群的rDNA ITS区(包括ITS1,5.8S rDNA,ITS2)碱基序列