论文部分内容阅读
一般而言,信号与信息处理系统由3个模块构成:信号预处理、特征检测描述、模式识别。其中特征检测描述模块的目的是从预处理信号中提取出相关特征,并将其量化成某种数值描述,以用于后续模式识别。因此,特征检测描述是整个信号与信息处理系统中非常重要的环节。事实上,灵敏、稳健和精确的特征检测描述是决定整个系统性能的关键。但由于客观世界具有多样性和复杂性,基于多尺度的特征检测描述是非常重要的技术问题,其近年来在生物、天文、地理等领域中得到非常广泛研究和应用。要想实现多尺度的特征检测,必然面临如下两个根本问题,即采用何种算子形式来引入多尺度表达?如何在多尺度表达下,融合各尺度信息进行特征检测?其中第一个问题,已在线性尺度空间理论及其推广中得到解决。而第二个问题却并不像前者那样存在统一的理论,对其研究则广泛散布于各类文献中。本文主要的工作及创新点,可以分为研究和应用两个部分。研究部分,在充分回顾总结前人工作的基础上,本文提出了一种多尺度融合的特征检测算法框架,以适应不同的应用场景。该框架主要由3个环节组成:单尺度特征检测、尺度空间深度结构建立、设计深度结构代价函数来确定最终特征。这些环节的设计并无统一理论指导,需要考虑具体的应用目标及背景知识等信息。应用部分,本文将多尺度融合的特征检测算法框架分别应用于生物蛋白质谱分析,电影胶片降质的检测和修复,以期检验该框架的有效性,并力图解决这两个应用领域中普遍存在的困难和问题。在这两个应用中具体的工作和创新性叙述如下。在生物蛋白质谱分析中,我们将多尺度特征检测的思想应用于峰值特征检测,以克服质谱畸变对现有分析系统的普遍干扰。首先,我们提出peak tree这样一种尺度空间深度结构来表达所有不同尺度下峰值特征的关系。而后,我们将峰值特征检测转化为peak tree的树分解问题。在树分解代价函数的设计中,综合考虑局部峰值特征以及全局共同峰信息,从而克服质谱畸变干扰。在此基础上,我们获得了一种新的闭环峰值检测算法,以迭代的方式逐步修正峰值检测结果。最后,我们在传统蚁群优化的生物标记特征选择算法中,加入了基于多元变量统计特性的启发信息和局部确定性优化,以提升其性能。基于上述算法的蛋白质谱分析系统,与传统方法相比,其峰值检测的准确性和用于疾病预测有效性,分别在基于虚拟质谱数据和真实SELDI质谱数据库的实验中得到验证。在电影胶片降质检测和修复中,划痕是最为常见且较难检测的一种胶片降质。与传统方法相比,我们的改进目标是一种全自动的稳健检测算法,能同时适应不同的划痕宽度,精确定位划痕区域,并能有效区分划痕和直线边缘。为此,我们首先设计了适于线状特征检测的复数Ridgelet滤波器,及相应的多尺度检测算法,以实现可变宽度划痕的精确定位并区分竖直边缘;而后,我们设计了基于Weibull分布模型假设的通用单模分布自动阂值选择算法,实现算法自动检测。最后,我们提出了基于邻域颜色距的校验,以提高整个检测算法的稳健性。上述算法的性能也都通过虚拟和真实数据加以验证。