基于深度学习的繁体中文图像文本化系统研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:lxzshenzhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了更好的传播与保护古籍文献资料,将古籍文献以电子文本形式储存是一种有效的方式。古籍的数字文本化主要由古籍图像的文字定位和文字识别两部分组成。深度学习是时下热门的研究方向,在图像识别、目标检测及自然语言处理等领域效果显著。中文古籍中汉字字体繁多且印刷体与手写体混杂,印刷体字体各有差异,同时有较多干扰噪声点,总体在文字定位及识别的技术要求更高。本文为了减少繁体中文图像录入成电子文本的人力成本,以深度学习技术作为主要识别手段,配合人工纠正辅助录入作为核心的算法进行设计研究。以Web可视化页面降低用户使用门槛,实现一套算法完整、效果可行的繁体中文文本化系统。目前深度学习在简体中文图像文本化领域已有较成熟的应用,但是在繁体中文图像,尤其在中文古籍资料领域的应用较为缺失。因此,繁体中文图像文本化问题的研究对深度学习的应用、中文图像中文字定位识别的研究有很大意义。本文针对古籍图像文本化任务,进行了研究与实验,主要内容和创新有以下几方面:1.在没有现成数据集的条件下,设计了一种数据集标注算法,即先通过MSER算法初步定位文字位置,之后以人工纠正的方式获得最终文字位置信息数据集。结合深度学习的One-Stage目标检测算法,设计了对单张古籍图像的文字定位算法,以VGG16为主干卷积网络对不同层的特征图以Anchors+Bounding Boxes方法检测定位文字位置。比较了传统图像处理方法和深度学习方法在繁体中文文字定位中的性能差异。比较了深度学习方法对于不同字体文字,不同尺寸文字的性能差异。本文对不同算法在性能上产生差异的原因进行了概括分析。2.以卷积神经网络作为基础,同时结合Inception模块和残差神经网络模块,设计构建了针对繁体中文古籍图像的文字识别深度学习模型。通过L1,L2正则、数据增广、Dropout等正则化技术进一步提升了深度学习文字识别模型针对不同文字的泛化识别能力。比较了多种主流深度学习模型和本文文字识别深度学习模型对印刷体文字和真实古籍影印文字在识别效果上的差异。比较了本文设计的文字识别模型在不同结构变体上的性能差异。比较了不同正则化方法对模型性能的影响。3.将本文的文字定位算法和文字识别算法相结合,设计并实现了从图像到数字文本端到端的文本化算法。以该文本化算法作为核心,以SSM(Spring+SpringMVC+MyBatis)作为框架,实现了繁体中文图像文本化的Web系统。文本化系统不仅包含将古籍图像文本化的核心功能,同时设计了用户登录功能,用户数据存储功能,定位结果修正功能,识别结果修正功能,识别结果下载功能。
其他文献
霍尔传感器可以无接触地感应磁场,位置或电流,这尤其适用于电动汽车,自动驾驶,智能电表,功率逆变器等应用。因此霍尔传感器作为磁力计、位置传感器和电流传感器被广泛应用于汽车、工业和消费类产品中。然而温度和失调电压的影响会降低霍尔传感器的精度,从而限制其使用范围,低精度的霍尔传感器完全无法满足使用者的需求,因此提高测量精度已经成为了霍尔传感器的研究热点。本文通过对霍尔元件原理、失调电压消除和温度补偿的理
随着新能源不断地被开拓,风能的可清洁性、极高的利用率和目前开发技术的成熟度都使风能成为当今世界密切关注的研究对象。随着对风能的不断研究,市场不断的打开和扩大,风机的装机容量也在与日俱增。对待并网,要求越来越严格。要求风电场必须可以稳定运行,即机组具备一定程度的低电压穿越(LVRT)能力。使电网发生故障时,风机必须能向电网补偿部分无功功率帮助故障快速恢复并在此期间仍然可以保持稳定运行,如何提高低电压
铁电和反铁电材料在压电驱动器、应变驱动器和储能电容器等领域有着重要的应用。早期,以Pb(Zr,Ti)O3、Pb(Mg1/3Nb2/3)O3等铅基体系为主的铁电和反铁电材料由于性能优异而引起了广泛的关注。上世纪90年代,人们意识到铅元素具有毒性,于是,包括铌酸钠(NaNbO3)在内的无铅材料成为新的研究重点。为了进一步推动无铅材料的发展,本文将围绕NaNbO3陶瓷进行相关的研究与探索。文献调研发现,
对话状态追踪是流水线任务型对话系统核心组成部分,负责估计当前轮次用户目标的信念分布。作为基本组成元素,对话状态中的领域、槽位或槽值之间通常存在着一些潜在的关联关系
当前世界范围内汉语热持续升温,全球学习汉语的人数快速增长。近年来,不少国家陆续将汉语纳入国民教育体系,海外汉语学习者也呈现低龄化倾向,对幼儿汉语教师形成了较大的需求。华文教育也面临着不同的挑战和机遇,为了满足新一代华裔儿童的汉语学习需求,扩大华文幼儿师资规模和提高华文幼儿教师素质成为华文教育必须面对且急需解决的严峻问题。华文幼儿教师的培养与培训是解决华文幼儿师资缺乏的重要途径。短期培训只能暂时增加
近年来,云正在成为存储大量数据的重要平台,它具有成本效益,并且很容易被世界各地的人们使用。随着云计算的不断发展,医疗云系统的建设也越来越完善。医疗云不仅可以提高现有医疗资源的利用率,还可以为用户带来便利。但与此同时,医疗云系统也涉及到用户的个人隐私,如身体状况、医疗记录等。此外,当用户登录医疗云系统访问医疗服务时,他们的个人信息是暴露的。如何在验证用户身份的同时还能保护用户的隐私仍然是一个挑战。因
本文将医疗信息系统安全作为研究对象,将现代化的深度学习技术应用于入侵检测系统,进而设计一个以深度学习为核心的入侵检测系统,最大化的体现深度学习(DL)中无监督学习的优势,并在融合算法的基础上对入侵行为进行精准的检测。本研究将卷积神经网络和长短期记忆循环神经网络进行融合,之后将融合后的网络对多种攻击行为进行检测,进而分析多种输入维度、卷积核大小和LSTM的记忆模块对检测性能产生的实际影响,最后得到的
随着高等教育的大众化,广西高等教育事业取得了长足进步,高等教育的规模不断扩大,随之而来的是资源紧缺问题越来越严重,教育资源供需矛盾日益突出,并制约广西地区普通高等教育稳健的发展。从目前广西地区高等教育资源分配现状来看,提高广西高等教育资源配置的效率是解决广西地区高等教育资源紧缺的重要措施。高等教育资源是广西地区高等教育质量与规模的先决条件,是为区域经济发展提供高素质从业人员的保障。所以,对广西普通
在中国经济结构调整、以去杠杆防风险为主、国际局势出现变化等的影响下,资金紧张,监管趋严使得我国上市企业再融资面临极大的困难。而并购重组业务受监管政策影响相对较小,并且监管层也始终鼓励上市公司通过并购重组做大做强,从而越来越多的上市企业通过并购重组来提升竞争力。但不容忽视的是,并购带来的高商誉也给投资者带来了更大的投资风险。近年来,已有学者开始着手研究并购商誉对企业股价崩盘风险的影响。受此启发,本文
不断上升的全球气温,使得北极的融冰速度日益加快,随着2017年“冰上丝绸之路”倡议的提出,以及现有航海科技手段的提升,使得北极东北航道的开通愈发紧迫。研究北极东北航道开通对全球海洋运输网络格局的影响,对东北航道以及环北极国家的港口投资建设,其他国家或地区的对外战略意向和贸易政策的制定,以及“冰上丝绸之路”倡议的推进具有深远的意义。研究首先基于2014年全球集装箱AIS(Automatic Iden