基于分段矢量量化的时间序列分类研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:tawj68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是由多个特定时间点上数据组合而成的高维向量,对于时间序列的分类决策是管理科学的重要分支之一。在传统意义上,决策的精度取决于决策者的个人经验,并受到外界因素和主观因素的影响。例如,只有学习过相关医学知识并积累了一定经验的医生才能看出患者心电图中隐藏的疾病。因此,如何客观准确地定量分析对时间序列的分类决策有着重要意义。矢量量化是将若干标量数据组合在一起,并在矢量空间中整体量化的一种基于分组编码的有损压缩算法。本文主要在分段矢量量化算法基础上对其相似性度量和分类标准等问题进行了研究。通过引入马氏距离、多码本及视觉重点等,对分段矢量量化算法进行改进,本文的主要工作包括如下三个方面:提出了基于马氏距离的分段矢量量化算法。标准分段矢量量化方法在产生码本时采用了欧氏距离,容易受特征量纲的影响。因而本文引入马氏距离,提出了基于马氏距离的分段矢量量化算法。所提方法采用马氏距离对未知样例及训练样本进行重构,并以马氏距离作为相似性度量计算重构误差来确定未知样例的类别。在基准数据集上的实验结果证实了该方法能够提高原算法的精确度。提出了多码本分段矢量量化算法。标准分段矢量量化算法只产生一个码本,忽略了类别信息对时间序列重构分类的影响。为此,本文通过对每一类数据均产生一个码本来实现多码本分类,提出了多码本分段矢量量化算法。实验证明,相比于分段矢量量化算法,所提算法提高了时间序列的分类精度。提出了基于特征点的多码本分段矢量量化算法。传统分段矢量量化算法的线性分段,可能会使得特征缺失从而影响最终分类。为此,本文通过计算特征点信息进行分段,最大程度上保留了时间序列的特征段,提出了基于特征点的多码本分段矢量量化算法。仿真实验中,设定总的码本大小一致,结果表明了所提方法的优越性。
其他文献
酸化压裂的效果一般通过酸蚀裂缝的有效长度及裂缝的导流能力来进行评价,酸蚀缝长越长,能够沟通更远距离的储层。本文通过软件模拟分析计算不同地质及工程参数下酸蚀裂缝的有
本文探讨了大数据思维:公共安全治理的新视角,分析了大数据技术:公共安全治理的新技术,研究了大数据应用:公共安全治理的新思考。
油气开采过程中会产生大量产出水,产出水处理后的再次利用于配制压裂液会减少环境污染同时减少水资源的浪费。产出水中含有大量化学组分,不同组分对压裂液影响的程度不同。因
《印度旁遮普邦班戈拉音乐文化的变化与发展》一文,通过笔者在研究生时期三年跟随印度音乐专家学习印度音乐的经历以及赴印度旁遮普邦的实地田野工作的经历,对班戈拉的历史、
气顶油藏是渤海黄河口凹陷常见的一类油气藏,该类油气藏具有典型的一砂一藏特征,单砂体储层薄,储量规模小。早期主要是采用“避气开发”、“油气同采”的开发模式。进入“双
20世纪90年代以来,随着冷战的结束、全球化的加速发展以及信息技术的日新月异,国际非政府组织(International Non-Governmental Organizations, INGOs)蓬勃发展,日益成为全球
<正>静脉血栓栓塞症(VTE)主要包括深静脉血栓栓塞和肺动脉血栓栓塞。是恶性肿瘤最常见的并发症之一,可导致肿瘤患者出血、血栓复发、死亡等。据统计,恶性肿瘤患者2年累计VTE发
蓬莱19-3油田注采优势通道明显,存在无效水循环,常规调堵体系在该区块注入性差,无法进入小孔道中提高微观水驱波及体积。本文以蓬莱19-3油田储层性质和流体为模拟对象,通过室
长庆气田部分气井出现不同程度井筒积砂、混合脏物堵塞现象,对气井的正常生产和后期测试产生了一定的影响。针对这种情况,提出了连续油管胶液+氮气循环顶替+交替注入冲砂工艺