基于OCR识别信息的语音合成在WEB上的实现

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:baby3911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与internet互联网的发展,人们的信息交流带来了巨大的变化。各种现代化的技术手段和大量丰富的电子信息资源,提供和服务于人类社会。其中现代化的技术之一,计算机模式识别与语音合成技术也得到了巨大的发展。文字识别技术在中文信息处理、办公自动化等高技术领域,都有着重要的实用价值和理论意义。语音技术已作为新一代智能应用的一项重要标志.它能为我们提供接近自然语言的人机通讯方式.从而达到人机对话的目的。多种信息化技术的结合是满足现代化、智能化、信息化发展需求的必然趋势。文字识别技术、语音合成技术的以及Web技术的结合,其应用领域将会更加广泛。 本课题是基于OCR识别信息的语音合成在Web上的播报,以实现一个图像信息向语音信息的远程转换,为智能化技术在未来计算机集成制造中的应用打下基础,使部门文档数字化、车间管理语音化,进一步提高生产效率。 整个系统由OCR部分和远程语音合成部分组成。OCR部分首先分析汉字识别的基本方法,并进行了比较分析,按照步骤详细介绍了“弹性网格”结合“神经网络”的识别方法,并使用java语言编程实现。由于硬件设备欠缺,使用汉王 OCR设备进行演示,并将数据格式进行转换。语音合成部分介绍了参数合成、拼接合成等合成方法,以及 SSML、S3ML技术在网络语音合成中的应用,并选择jTTS语音合成服务器作为语音合成平台。最后通过一个《在线考试演示系统》,将两部分有机结合起来,从数据库中读取OCR模块识别的用户信息,根据成绩进行远程语音合成和语音播报。在本项目的开发过程中,注重使用 Visual Studio.NET 中的C#.NET、ASP.NET 和 ADO.NET 技术,结合使用 SQL Server 2000 数据库,使得软件的结构更趋合理、方便及实用。结果表明,“神经网络”进行 OCR 识别具有更强的稳定性,OCR 信息通过网络进行远程语音合成最终转换成语音信息。
其他文献
随着网络应用的迅速普及,信息系统面临着日益严重的安全威胁,人们对于信息安全的需求日益迫切。安全审计作为信息系统的一种安全保障机制,对于系统行为的监控、电子证据的提供都
互联网的开放性为信息共享和交互提供了极大地便利,但随之而来的网络安全问题也日益严峻。入侵检测作为一种主动的信息安全保障措施,有效地弥补了传统安全防护技术的缺陷。入侵
随着信息技术的突飞猛进,计算机网络的普及与发展正改变着人们的工作、学习和生活方式。它的发展和应用对整个科学技术、经济发展、国防建设和文化思想带来了巨大的影响和推动
随着现代科技和计算机技术的不断发展,人们在与机器的信息交流中,需要一种更加方便、自然的交互方式,而语言是人类最重要且最有效的信息源,实现人机之间的语音交互,让机器听懂人的
在嵌入式操作系统领域,微软公司的Windows CE.Net占绝对的统治地位。Windows CE.Net的汉文版已经在国内广泛应用。随着嵌入式智能设备的日益普及,实现Windows CE.Net操作系统
随着信息处理和计算机技术的发展,声纹识别技术在司法侦察、电子商务、军事通信等许多领域有着极其广泛的应用前景,涉及到语言学、语音信号处理、模式识别与机器学习等知识领
随着Internet规模的迅速扩大和重要性的日益显著,越来越多的问题迫使人们开始关注网络带宽测量,带宽测量一直是重要的研究方向,它对于人们了解网络行为、提高网络性能、改善
伴随着网络技术和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源,人们可以轻松地从网络上获取各种各样的多媒体信息。与此同时大量诸如非法复制、伪造、篡改
软件的可靠性差和开发效率低一直是困扰软件产业界的两大难题,高效率地开发正确、可靠的软件已成为软件产业的迫切要求。尤其在现在各种大型数据库处理系统,商业网站特别是一
随着科技文献的电子化,科研人员对文档图像的自动识别与理解的要求也越来越高。随着OCR技术的发展,基本实现了对文档图像中文字的识别理解。然而针对文档图像中数学公式的自动