论文部分内容阅读
多维时间序列是一种同时具备空间和时间描述能力的数据,广泛应用于事物动态行为特征的描述与表达,是一种非常重要的数据形式。基于多维时间序列分类技术的动态行为过程识别是一项非常具有实际应用价值的研究工作,并已得到大量的关注和研究。为了实现多维时间序列的有效分类,本文对相关技术进行了较为全面的研究。这些技术主要包括:多维时间序列的特征提取技术、特征选择技术和分类技术。基于这些技术,可以完整实现多维时间序列的分类。具体地,全文的研究工作主要包括如下几个方面:(1)为了便于构建分类模型,需要首先获得多维时间序列的特征表示。对此,本文首先对多维时间序列的特征提取技术进行了研究,然后在分析现有方法不足的基础上,提出了一种基于小波包变换的特征提取方法。该方法可以从不同时频尺度上提取序列的特性,获得尽可能完整而丰富的特征描述,且避免了特征提取过程中造成的信息损失。同时,提取过程中不需要人为设定任何参数,对不同序列长度不同而引起的困难处理十分简单。由于获得了序列完整的时频特征信息,因此为不同类别序列的区分提供了良好的基础。(2)基于小波包变换的特征提取会得到大量无关和冗余的特征,若直接基于这些特征构造用于分类的特征向量,不但会造成特征向量的维度非常高,而且会对最终建立的分类模型的分类性能产生负面影响。对此,本文研究了特征选择技术,通过该技术将初始特征集中无关和冗余的特征剔除,最终获得对分类真正有效的特征。在研究过程中,首先分析了经典特征选择算法ReliefF,了解了其存在的缺陷,然后提出了一种改进型算法ReliefF-SFB-SVM,获得了比ReliefF更好的性能。最后通过实际数据集上的实验,对比了其与ReliefF和mRMR的实际性能。结果表明,ReliefF-SFB-SVM可以用比ReliefF更少的特征获得最佳的分类准确率,而与mRMR具有相近的分类性能但具有更高的运行速度。(3)基于特征提取与特征选择技术获得多维时间序列最终的特征向量表示之后,即可基于特征向量构建多维时间序列的分类模型。因此,本文最后对分类算法进行了研究。研究过程中,考虑到SVM分类模型具有很强的泛化能力,且能处理非线性可分的问题,为了利用SVM的这些优点,同时获得多分类能力,本文提出了一种新的树结构M-SVM多分类模型TSM-SVM,并通过实验对比了其与PNN和OVA-SVM的性能。结果表明,该模型具有比OVA-SVM更快的分类速度,且具有比PNN更高的分类准确率,同时保证了理想的训练速度。