基于语音识别与合成的低速率语音编码研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:G00G01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代通信技术中,人类语音是最重要、最基本的交流媒介并将成为未来人机交互的主要手段。由于考虑到传输效率、耗费成本、占用的物理信道、存储空间等因素,人们总希望在保证较好语音质量的前提下,尽可能的压低语音编码的传输码率。因此,语音传输一般要经过压缩变成比特流的形式。这个压缩语音信息过程被称为语音编码。由Shannon理论可知,语音数据压缩是存在极限的。目前的信源编码方式已经接近极限,因此我们以牺牲算法的复杂度来无限逼近Shannon极限已经变得毫无意义。如果我们从信宿(接收者)的角度来考虑,根据信宿端的需求对发送端语音信息进行基于内容的压缩,去除大量非内容信息,这样就可以大大提高语音信号的压缩效率。本文主要工作及创新点有:1.论文首先对语音通信技术的现状进行了研究和总结,分析了极低速率语音编码应用领域及其重要意义。对国内外语音通信中的语音识别、语音合成和预处理等关键技术做了详细分析研究和仿真实验,并指出目前存在的不足。2.本文对语音信号端点检测的三个特征参数短时能量、短时平均过零率和基本谱熵进行逐一研究分析,在此基础上提出了短时能零熵值这种新型的语音参数,并作为端点检测的主要参数。3.试图寻找一种基于信宿相关的低速率语音编码。其理论依据是:语音的内容信息量总是小于语音的数据信息量。通过语音识别技术针对组成语音的基元,采用仿生模式识别后得到文本信息,把与文本信息相对应的标准语音和说话语音进行“比较”运算后得到个体特征信息,然后再对识别出的语音基元文本信息和个体特征信息进行编码、传输就可得到极低的编码速率(<80bit/s),在接收端,利用语音合成技术将文本信息和个体特征信息转换为语音输出,从而形成完整的语音传输过程。本文的研究主要应用于水声通信和军事通信,由于通信速率比较低,即使能够满足基于语音识别的语音实时通信,但是对于海、陆、空三维立体通信互联来说还是远远不够的。加快发展我国在该领域的技术进步是一项很紧迫的任务。
其他文献
可见光无线通信因其无电磁干扰、节能、绿色等优点引起了广泛的关注和研究。随着对可见光通信技术研究的逐步深入,研究人员发现光学接收系统在特殊环境中的通信性能受到了局限
随着网络信息技术及数字多媒体技术的高速发展,二维CAD工程图在众多行业在广泛应用,二维CAD工程图形遭到非法使用和修改、编辑等盗版侵权问题也日益突出。二维CAD工程图的数
人脸检测技术作为人脸信息处理中的一项关键技术,越来越受到研究者们的关注。人脸检测过程是将检测区域做一个“人脸”或者“非人脸”的判断的过程,人脸检测算法就是通过这个
随着信息技术和视频技术的发展,3D产品已经走入消费者的日常生活中,然而其在传输和储存过程中易受到不法分子的盗用和破坏。原创者需要保护自身的创作权和版权,除在法律层面
在科技不断取得创新和发展的大背景下,数字多媒体技术(Digital Multimedia Technology)也得到了推广及应用。其中,图像视觉信号已成为数字化多媒体传播信息的主要载体之一,大
无线传感器网络(WSN,Wireless Sensor Networks)具有节点数目众多、资源容易受限以及组成的节点同构性的特点。因此,如何通过利用WSN节点感知数据的相关性对数据进行压缩,并
随着物联网技术的发展,作为物联网的基本构成单元和一种重要应用,智能家居系统成为了人们关注的焦点。面对巨大商机,各个智能家电厂商纷纷推出了自己的面向物联网的智能家电终端
为了保证变压器等电气设备在生产运营过程当中正常健康的运行,对其运行状态进行实时在线监测是非常必要的。基于振动波谱的变压器状态监测技术目前已成为变压器状态监测研究的新课题,该方法通过对采集到的变压器油箱表面的振动信号进行分析,提取出能够精确表征变压器振动状态的特征参数,用以完成对变压器振动状态的监测。本文首先对变压器上不同测点信号间频谱成份的相关性进行了深入研究,对不同情况下测点间的信号应用交叉小波
正交频分复用(OFDM)技术作为下一代通信网络的主要调制技术,有着良好的抗干扰性能以及更高的频谱利用率,而在其基础上发展的多址技术——正交频分多址(OFDMA)技术,成为第四代
随着新一代无线通信技术的不断演进和成熟,高速的传输速率和丰富的多媒体应用,对智能手机的性能和功耗提出了更高的要求,因此省电技术成为目前研究工作的关键。同时,基于虚拟技术