论文部分内容阅读
茶叶(Camellia sinensis L.)是一种栽培的常绿植物,它已经有5000多年的历史了。茶叶最早产自中国,它是继水之后,世界上第二大最受欢迎的饮料。茶叶提神的功效和令人舒畅的味道已深入人心,如今它潜在的健康效益和药用价值也越来越引起人们的关注。茶叶的主要化学成分包括茶多酚类、咖啡因、氨基酸等。据报道,这些成分的抗氧化性能和杀菌功能可以抵抗炎症和预防蛀牙。此外,以动物为模型的流行病学研究报告表明,绿茶可以预防一些癌症,例如皮肤癌、乳腺癌、肝癌和肺癌。
茶叶质量的检测和控制关系到消费者切身利益和身体健康,影响到我国出口茶叶在世界茶叶市场的地位和声誉。因此,需要一种现代的科学手段来鉴别茶叶质量等级。本文中,可见近红外光谱作为一种简单、快速、无损的分析方法被用来鉴别同一品种乌龙茶质量等级。
可见近红外光谱技术具有快速、无损分析样品的特点,并且很少需要对样品进行处理。近年来,它被广泛的作为很多领域的分析工具,例如石油化工、制药、环境、临床、农业、食品和生物医学等。一个样品的近红外光谱图包含大量的光谱变量,当用光谱学中的化学计量学处理这些变量以对因变量进行预测时,我们认为这种做法是不可靠的。现在,人们努力的开发和评估不同程序来客观的区分变量:找出具有价值的信号和减少包含噪声的信号变量。近红外光谱中变量选取的方法包括人工神经网络、偏最小二乘法、线性判别、支持向量机等等。
本文主要目的是研究茶叶光谱及其质量等级之间的关系。详细步骤是评价可见近红外光谱鉴别茶叶等级的潜能和建立有效的BP神经网络模型来区分四种质量等级的茶叶。四种等级的茶叶光谱特征具有明显的区别,因此可以用来建立区分关系。对所有数据进行归一化处理后用三种不同方法进行预处理,然后用主成分法分析数据,得到前三个主成分的3维散布图。在3维散布图上,可以明显看出四种样品的分布趋势。把所有样品的光谱数据随意分成训练集和预测集后,建立BP神经网络模型。利用交叉验证法得到四个模型的最优化的主成分个数,分别为10,6,10和6,以此作为神经网络的输入向量个数。通过残差均方根的最小值来确定神经网络隐含层的节点数,得到四个模型的隐含层节点数为分别为8,7,5,9。用建立好的网络模型进行训练和和测试,结果表现良好。在训练集中,四种模型的区分度达97.3%,97.32%,100%和100%;在测试集中,四种模型的区分度达92.3%,98.2%,98.2%和100%。其中对吸收数据进行一次求导的BP神经网络模型达到了100%的区分度。由此可见,可见近红外光谱结合主成分分析和BP神经网络可以用来快速无损鉴别茶叶质量等级。
另外,我们用可见近红外光谱技术结合PLS和BP神经网络来鉴别鸡内金和鸭内金。鸡鸭内金的区别可以在反射光谱图上清晰的反应出来,我们可以用来建立区分关系。光谱数据预处理后,对其进行交叉验证处理,得到最佳主成分个数为3,以此作为神经网络的输入向量维数建立PLS和BP神经网络。经过选取最佳参数后训练网络,训练结果和预测结果表现良好,达到了100%的识别率。实验表明,多变量结合神经网络具有很高的种类识别率和检查精度。可见近红外光谱可以应用在模式识别领域内。