论文部分内容阅读
近年来,仪器分析化学技术和计算化学的发展产生了许多庞大的多维数据,其中包含着更加全面、丰富的化学信息,但同时也增加了提取有效特征信息和多维精准校正的难度。图像矩方法作为一种特征信息提取的技术,目前已经初步用于分析化学领域的部分三维谱图分析。为了进一步深入研究图像矩方法的普适性和稳定性,以扩展其更多的实际应用,必须探索图像矩在分析化学领域新应用的可行性及其优势。作为离散正交矩的Tchebichef矩在图像矩中具有优异的性能,除了平移、旋转、缩放不变性和多分辨率能力,其计算过程中还减少了数据冗余和离散化误差,使结果更加准确、稳健。因此,在本研究中我们将Tchebichef矩应用于两种不同类型的数据开展了定量分析的研究。工作之一是基于高效液相色谱-质谱联用仪(HPLC-MS)全扫描模式的三维谱图数据。不同于光谱和色谱,质谱的信号是棒状离散的,同时其全扫描模式虽然可以大范围同时获取信号,但是由于色谱峰重叠、未知信号干扰等问题难以用于复杂体系的定量分析。工作之二是基于分子二维结构图像的定量构效关系分析。这种近年来发展的新型定量构效方法无需复杂的量子描述符,而是采用基于化学结构图像本身的多元分析,但它最大的缺陷是需要母体化学结构的像素对齐,在大量样本的定量构效研究中往往耗时费力。因此,我们将Tchebichef矩方法应用于上述两种类型数据,以解决分析化学中的实际问题,同时对Tchebichef矩方法进行了严格的验证确保结果的可信度,探究该方法的优越性。本学位论文主要包括:第一章绪论。简要概述了化学计量学和图像矩的背景、发展现状和前景,以及本学位论文的主要研究内容。第二章将Tchebichef矩方法应用于HPLC-MS全扫描模式对清热解毒口服液中的京尼平苷、连翘苷和龙胆苦苷三种有效成分进行同时定量分析。基于获得的三维谱图直接计算Tchebichef矩变量,并通过逐步回归算法建立了三种活性化合物的定量线性模型。其相关系数均大于0.9978,检测限和定量限分别低于0.11μg m L-1和0.49μg m L-1,以相对标准偏差(RSD)计算的日内和日间精密度分别小于6.54%和9.47%,而回收率在102.56%至112.15%之间。由于Tchebichef矩的多分辨能力和平移、旋转、缩放不变性,该方法可以在色谱峰重叠和漂移以及未知成分干扰和噪声信号的情况下获得较为理想的定量结果。第三章分子结构图像结合Tchebichef矩方法对系列抗HIV-1化合物的活性进行定量构效关系分析。针对一系列HIV-1非核苷类逆转录酶抑制剂,用基于分子结构图像计算的Tchebichef矩作为分子信息的描述符,并通过两个简单的线性回归算法——偏最小二乘法(PLS)和逐步回归建立了QSAR模型。为了验证方法的可靠性,我们对模型进行了充分而严格的统计分析,证实了Tchebichef矩方法可以在无需任何图像前处理的情况下有效地提取图像中的综合化学特征,并获得了令人满意的结果。第四章分子结构图像结合Tchebichef矩方法对苯胺、苯酚类化合物进行水生物毒性的评价。苯胺和苯酚作为两种大量生产的工业化学品被广泛应用,对其的环境风险评估具有很大的现实意义。基于其分子结构图像进行计算提取的Tchebichef矩可以同时对费氏弧菌和月牙藻两种水生生物的毒性建立定量构效关系(QSAR)模型。与之前的方法相比,我们的模型具有更好的性能和预测能力,并可以免去图像数据的预处理过程。因此,所提出的方法为QSAR研究应用于有毒化合物的环境风险评估提供了一种新的策略。第五章主要结论与展望。总结了Tchebichef矩方法在以上两种数据中应用的优势,展望了Tchebichef矩方法在分析化学前沿中的应用前景。