论文部分内容阅读
近红外光谱(NIRS)分析技术能快速无损的测定样本,已在医疗行业和药品监督管理机构中得到了广泛的应用。针对NIRS药品鉴别领域,虽然,现有机器学习算法能较好解决NIRS样本中谱带宽、重叠严重、吸收信号弱及信息解析复杂等问题。但是,这些算法忽略了NIRS药品鉴别中的类不平衡和代价敏感问题,以及相关分类模型中存在稳定性、系数相关性和求解速度较差问题,目前这些问题成为制约NIRS药品鉴别方法在全国大规模推广的瓶颈。本文针对NIRS药品鉴别中存在的问题,对三种不同的机器学习算法:支持向量机(SVM)、极限学习机(ELM)以及最小二乘协同表示(CRC-RLS)进行改进,提出了面向NIRS药品鉴别的三种分类模型,其具体研究内容如下:(1)提出布谷鸟优化尺度化凸壳(SCH(CS))分类模型。针对非线性分类和类不平衡问题,采用调整尺度因子的方式压缩正负类样本,提高分类准确率和泛化能力;针对SCH收敛速度较慢的问题,采用布谷鸟搜索(CS)方法来优化模型参数,降低分类模型的训练时间;针对NIRS药品鉴别中代价敏感问题,构建代价敏感尺度化凸壳Cost-Sensitive SCH分类模型,有效减少药品NIRS鉴别中由于类不平衡问题引发的平均错分代价。(2)提出波形叠加极限学习机(SWELM(CS))分类模型。针对ELM网络稳定性差和收敛速度慢的问题,采用反双曲线正弦函数与Morlet小波函数叠加函数代替ELM原有的单一激励函数,提高了分类模型的稳健性和收敛速度;针对ELM参数优化算法易陷入局部最优点且训练时间较长的问题,采用CS方法来优化模型参数,提高了分类模型的稳定性和收敛速度。(3)提出Gabor优化协同表示(CRC_GRLS)分类模型。针对CRC-RLS的L2范数求解稀疏度较低的问题,采用Gabor滤波器对L2范数的稀疏解进行滤波,以获取包含更多相关信息的非零系数(相关系数);针对全局多标签分类到二分类调整问题,引入KNN局部分类调整,提高了CRC_RLS二分类模型的分类准确率。本文将上述三种改进的分类模型引入到NIRS样本药品鉴别中,通过三个不同来源的药品NIRS样本,对其进行二分类性能(药品鉴别性能)实验,证明三种改进的分类模型相比于传统分类模型具有更高的分类准确率、分类稳定性以及收敛速度更快。本文的最后,为所研究的三种分类模型设计GUI人机交互界面,并取得了较好的应用效果。