论文部分内容阅读
随着计算机技术与internet互联网的发展,人们的信息交流带来了巨大的变化。各种现代化的技术手段和大量丰富的电子信息资源,提供和服务于人类社会。其中现代化的技术之一,计算机模式识别与语音合成技术也得到了巨大的发展。文字识别技术在中文信息处理、办公自动化等高技术领域,都有着重要的实用价值和理论意义。语音技术已作为新一代智能应用的一项重要标志.它能为我们提供接近自然语言的人机通讯方式.从而达到人机对话的目的。多种信息化技术的结合是满足现代化、智能化、信息化发展需求的必然趋势。文字识别技术、语音合成技术的以及Web技术的结合,其应用领域将会更加广泛。
本课题是基于OCR识别信息的语音合成在Web上的播报,以实现一个图像信息向语音信息的远程转换,为智能化技术在未来计算机集成制造中的应用打下基础,使部门文档数字化、车间管理语音化,进一步提高生产效率。
整个系统由OCR部分和远程语音合成部分组成。OCR部分首先分析汉字识别的基本方法,并进行了比较分析,按照步骤详细介绍了“弹性网格”结合“神经网络”的识别方法,并使用java语言编程实现。由于硬件设备欠缺,使用汉王 OCR设备进行演示,并将数据格式进行转换。语音合成部分介绍了参数合成、拼接合成等合成方法,以及 SSML、S3ML技术在网络语音合成中的应用,并选择jTTS语音合成服务器作为语音合成平台。最后通过一个《在线考试演示系统》,将两部分有机结合起来,从数据库中读取OCR模块识别的用户信息,根据成绩进行远程语音合成和语音播报。在本项目的开发过程中,注重使用 Visual Studio.NET 中的C#.NET、ASP.NET 和 ADO.NET 技术,结合使用 SQL Server 2000 数据库,使得软件的结构更趋合理、方便及实用。结果表明,“神经网络”进行 OCR 识别具有更强的稳定性,OCR 信息通过网络进行远程语音合成最终转换成语音信息。