论文部分内容阅读
谎言检测在公共场所安全检查、雇佣人员职业测评、公安侦查和保险金融信用评估领域具有重要的应用,引起了学术界的广泛关注。相比于分析脑电信号、心跳和呼吸速率、皮肤排汗量和测谎仪等依赖人体生理信号和专业仪器的测谎手段而言,基于语音分析的谎言检测更为方便自然,不易引起受试者的抵触情绪和恐惧、紧张心理。语音测谎研究涉及语音特征提取、信号分析、分类识别等方面,目前尚处于探索阶段。如何用语音特征来表达谎言信息,以及建立合适的模型来检测谎言都有待于深入研究。本文提出了一种结合小波包变换和稀疏分解提取语音测谎特征的方法,并结合机器学习模型构建语音谎言检测系统。主要研究工作如下:首先,在阐述语音谎言检测研究背景、意义的基础上,分析了谎言检测的研究历史,以及国内外语音测谎的研究现状,指出了语音测谎研究中存在的主要问题。其次,提出了一种基于小波包变换的小波包频带倒谱系数作为语音特征用于谎言检测。鉴于现有测谎研究较少关注语音频域特征,本文利用小波包分析良好的时频特性及多尺度分析特点,结合倒谱分析法提取信号中、高频段表征谎言特性的重要信息,即小波包频带倒谱系数。结合多种分类器进行多组对比实验,确定最优小波包频带倒谱系数特征的频带划分方式,验证了小波包频带倒谱系数对语音测谎的有效性。最后,提出了一种稀疏分解算法对融合特征提取稀疏特征,并用支持向量机实现分类检测。针对多类特征融合下的特征集内存在维数过高和参数冗余的问题,提出了一种字典学习结合稀疏编码的稀疏分解算法,对融合特征参数集进行稀疏分解以获取稀疏特征,从中获取表征谎言的有效信息。通过多种分类器下的大量对比实验,确定了最优过完备表示字典的获取方式以及稀疏特征的维数。实验结果表明,在支持向量机分类器下,小波包频带倒谱系数结合梅尔频率谱系数提取的稀疏谱特征取得了较好的谎言检测结果,显著提高了测谎系统的性能。同时验证本文所提出的特征参数稀疏分解算法,测谎性能优于主成分分析法、K-奇异值分解字典学习算法。