基于可视化表示原理的语音情感识别技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liongliong511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别是情感计算研究中的重要课题,在智能化的人机交互界面设计、提高语音识别的准确性和情感翻译等方面有着广泛的应用前景。而可视化作为模式识别中的一种新方法,也正在越来越受到研究者的重视。本文的主要工作就是将多元数据图这种可视化的方法引入到语音情感数据的表示和识别中,以图增强数据的直观可视效果,提高人在识别过程中的参与作用,并通过对多元数据图表示的优化和改进,增强最终的识别性能。本文首先从分析了语音中常用的声学特征,分析其区分情感的能力。最终选取了短时能量、基频、语速、共振峰等参数和其衍生出的情感特征。接下来使用多元数据图的方法对这些情感特征进行可视化分析。首先使用雷达图,并就雷达图表示最重要的排序问题进行了讨论和研究。使用了两种排序算法进行比较,并提出了计算量小、性能良好的排序算法,基于模板特征优化的方法。然后使用了更加形象的脸谱图来表示情感特征数据。为了使脸谱图在表示数据时能够在一定程度上表达数据的情感内涵,既保留了脸谱图的优良性质又做了一定的理论突破,使用了最小二乘法优化求出情感数据到脸谱图之间的映射关系。最后结合雷达图和脸谱图的优点,提出了着装脸谱图的融合方法,最终在性能上达到最优。在使用多元数据图的过程中,对各个图形表示方法进行了优化和算法上的改进,并最终将各个方法融合进着装脸谱图,形成一个完整的多元数据表示系统。在最后对实验语料进行的识别实验中,识别结果超过了未使用多元数据图的方法并达到较为满意的效果,证实了此方法在语音情感识别的有效性。
其他文献
本文旨在分析抽取Web企业信息系统的共性特征,采用“软件构件化”方法设计并实现了一些通用基础构件,以便于更快速地搭建基于Web的企业信息系统。本文首先阐述了构件技术和构
无线传感器网络(以下简称WSNs)集成了无线通信技术、传感技术、计算机技术等三大技术,被认为是21世纪最重要的新技术之一。WSNs由大量廉价微型传感器节点自组织而成,具有低功
随着互联网的普及、云计算的出现以及物联网的迅速发展,网络安全问题日益突出,安全漏洞和安全事件大幅度增加。网络蠕虫、黑客拖库、0day曝光以及个人隐私数据泄漏等网络安全
高速公路是人类社会前进的基石,是实现经济社会现代化的必然选择。它有效的促进沿线工业和农业经济的高速发展,为改善商品流通环境、促进市场繁荣起到极其重要的作用。我国高速
随着我国经济的高速增长,企业间的竞争也越来越激烈。旧的企业经营管理体制已经不能满足企业的发展要求,要想在激烈的竞争中求得生存,就必须改进现有管理模式,并借助管理信息系统
随着Internet的迅猛发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大的动态信息服务网,为用户提供了一个极具价值的信息源。传统的信息搜索技术由于对这些信息的
可视秘密共享是在秘密共享的基础上发展而来的对秘密图像的共享。目前可视秘密共享方案的瓶颈是通信效率、密图重构效率和质量等问题。基于神经网络的可视秘密共享方案是秘密
随着网络的发展,网络资源呈现突飞猛进的增长,这给WEB用户带来了诸多不便,搜索引擎应运而生。然而不同背景、不同目的、不同时期的用户的信息需求往往是不同的,搜索引擎面对
近年来,随着手持设备技术的发展和无线通信技术的更新,移动支付得到迅速的发展,频繁地出现在人们的视野中,然而许多人并没有接受这个新兴的商务模式,关键在于人们对移动支付安全性
Web服务提供了跨平台、操作系统、编程环境的良好的互操作性,可使用松散耦合的集成模式实现异构系统之间的柔性集成,比传统的DCOM、RMI和CORBA要好得多。它还能在帮助简化B2B