基于计算听觉场景分析的混合语音分离研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sukey2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算听觉场景分析是利用听觉心理学和生理学的知识,让计算机来模拟人类听觉系统处理声音的过程。基于计算听觉场景分析的混合语音分离问题是目前人们研究的重点,该技术对于语音识别、多媒体检索、人工智能的发展都具有重要的意义。计算听觉场景分析中最重要的问题就是选择合适的声音分离线索,现有的计算听觉场景分析系统大都只能分离具有周期结构的浊音,而忽略了对清音的分离。研究表明声音的起始(onset)和结束(offset)时间通过信号能量的突然变化来分离声音,与语音中的清浊无关。因此本文基于计算听觉场景分析的理论,提出了使用onset/offset线索完成混合语音分离的思想。该方法通过在时域和频域上检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段来实现混合语音的分离。通过实验可以得出onset/offset线索能够同时处理清音和浊音的分离,解决了用不同的声音线索处理清音和浊音的问题,使得算法更为简单;并且onset/offset线索对混合声音的类型没有限制,无论对于音乐、语音还是噪声都可以进行分离处理并都得到了很好的分离效果。
其他文献
现如今,随着世界上各个国家的相互融合,英语作为交流工具的作用正在日益凸显。近年来,我国大学英语教学取得了极大的进步,但与此同时,一些问题也随之出现。本文针对大学生英
当前所在我国信息技术的不断发展,我国以计算机技术为核心的传媒信息时代也已经到来,这样不仅能够给大学英语教育发展带来一定的优势和机遇,也是给大学英语教育创新发展所带
在大学英语教学中,接触到学术词汇的频率是非常高的,尤其是在实际写作中。熟练的掌握好学术词汇是学生综合语言水平能力的体现。但是,目前在大多数的大学英语写作教学中老师
文化是一个国家经过历史的变迁所传承下来的重要财富,对自己文化的态度、信念是该文化是否得以传承、发扬的重要因素.大学生群体是国家未来发展的主力,承担着继承和发扬中国
近年来,RFID(Radio Frequency Identification)射频识别技术的迅猛发展给社会中各行各业带来了前所未有的发展机遇。目前主流的ISO/IEC 18000-6C UHF RFID协议是一种国际通用
随着改革开放程度的日益提高,英语作为一门国际性的语言在社会生活中发挥着越来越重要的作用,英语教学的地位在职校的教学中越显其突出作用。但职校学生一般英语基础比较薄弱
长期演进技术(LTE,Long Term Evolution)是由3GPP在2004年底经过认真的讨论后制定出的一种移动通信标准,因其采用的OFDM(正交频分复用)、MIMO(多输入多输出)、高阶调制等核心技
【摘要】“书面表达”是高考必考内容,旨在考查考生的英语表达能力,看其是否能够运用所学过的英语知识和掌握的写作技能进行思想交流。  【关键词】七项原则 八项注意  “书面表达”是高考必考内容,旨在考查考生的英语表达能力,看其是否能够运用所学过的英语知识和掌握的写作技能进行思想交流。然而,目前学生的写作能力不是很理想,总分为25分的书面表达,一般学生的平均得分在13分左右。考生在英语写作中存在的主要问
正交频分复用(OFDM)技术是一种多载波调制技术,它具有很强的抗多径衰落能力,而多输入多输出(MIMO)技术可以在不增加带宽的情况下提高通信系统的容量和频带利用率。OFDM和MIMO