【摘 要】
:
书刊文献资料数字化,是降低管理成本,提高检索效率,实现资源共享的有效途径。利用书刊专用扫描仪和文字识别技术可以高效完成书刊数字化任务。本课题设计的书刊专用扫描仪,由“V”形载书架、工业相机和嵌入式AI开发板组成。将书刊放入“V”形载书架,利用工业相机完成图像采集,同时利用Jetson Nano嵌入式AI开发板进行文字识别,输出识别文本。针对书籍、杂志、古籍等横纵向书刊场景文本,利用深度学习技术,实
论文部分内容阅读
书刊文献资料数字化,是降低管理成本,提高检索效率,实现资源共享的有效途径。利用书刊专用扫描仪和文字识别技术可以高效完成书刊数字化任务。本课题设计的书刊专用扫描仪,由“V”形载书架、工业相机和嵌入式AI开发板组成。将书刊放入“V”形载书架,利用工业相机完成图像采集,同时利用Jetson Nano嵌入式AI开发板进行文字识别,输出识别文本。针对书籍、杂志、古籍等横纵向书刊场景文本,利用深度学习技术,实现扫描图像的文本检测与文字识别。本文基于实用场景提出一种基于嵌入式设备、轻量级的书刊文本检测识别模型,基于Tensorflow深度学习框架,在文本检测模型CTPN和文字识别模型CRNN+CTC两个神经网络基础上进行优化。基于书刊文本字符分布特点,CTPN模型改进了Resnet50特征提取层,Anchor分布,并且编写后处理算法,实现对书刊文本的准确定位、分类、切割等效果。CRNN+CTC模型通过增加CNN层提升了文字识别的准确度,并编写后处理排版算法,实现文本顺序输出。构建深度学习数据集,针对网络训练过程中,现有开源数据集无法满足课题需求,采集制作6300张实际横向书刊检测数据集,1000张纵向书刊检测数据集,通过数据集生成方式,生成270万横向书刊识别数据,通过数据增广处理生成60万张纵向书刊识别数据集,利用GPU服务器进行训练,经过500批次训练后,同类书刊文本横向检测准确率达到93.30%,纵向检测准确率达到78.20%,文本横向识别准确率达到88.87%,纵向识别准确度达到72.31%,后续可以通过增加数据集进一步提升识别率。利用Pyside2编写扫描仪用户界面程序,使用Open CV对图像进行采集、处理,最终传入嵌入式设备Jetson Nano进行检测识别处理,实现从书刊图像到数字文本的过程。本文研究内容基本可以满足应用需求,具有一定的工程应用价值。
其他文献
清代是苏轼研究的集大成时期,同时是我国古典诗话发展的黄金时代,清乾隆时期则尤为繁盛。本论文的研究范围为清乾隆时期的诗话,研究对象为此时诗话中的苏轼,以苏诗为主,文学思想、苏轼形象为辅,略带苏词、苏文。本论文通过梳理、分析、总结乾隆期诗话论及苏轼的主要内容及典型特征,深究三种诗话个案作具体论析,同时结合我国古代接受诗学理论探讨特定时代背景下学者评论苏轼的审美价值。本论文所研究的“清乾隆时期的诗话”,
将中国建设成一个美丽和谐的社会,是我党始终坚持的目标和奋斗方向。同时,美好的生活环境和社会发展空间也是全国人民所希望的。要建设美丽中国,需从基础的乡村建设开始。进入新时代以来,习总书记着眼未来进行宏观布局,从实践出发,重视美丽乡村的建设和振兴。在党的第十九次全国代表大会召开后,正式确立了乡村振兴战略。为响应《中共中央、国务院关于打赢脱贫攻坚战的决定》和坚持精准扶贫的理念,本研究将基于安徽省六安市金
本研究以辽宁省阜蒙县二道岭小流域坡面径流场为研究对象,设置不同水土保持措施的人工径流小区,采用野外人工监测与仪器自动监测相结合的方式,对研究区降雨、地表径流、土壤流失等情况进行监测,分析对该区域降雨特征、坡面产流产沙过程及不同水土保持措施减流减沙效益,为低山丘陵区水土保持措施制定提供科学指导。本论文得到的主要结论有:(1)通过研究区域2015到2021年间降雨特征可知,侵蚀性降雨96次,总降雨量2
计算机的诞生、互联网科技的出现、信息传媒科技的兴起等,革新了基于印刷技术的纸张发行形态,在提高纸张发行效益的同时,也孕育了音像发行、电子出版和互联网发行等崭新的发行形式。在新技术赋权与出版业“去内卷化”的情况下,将传统出版物和数码出版结合发展即融合出版业已成为重要策略。目前学界关于融合出版的理论研究尚在起步阶段,主要集中在融合出版的背景、概念及案例,与理论的结合不够深入,学理层面的研究相对匮乏。“
三维重建技术是计算机视觉的重要研究内容之一。通过线激光扫描被测物体,计算得到被测物体表面的点云数据,然后再将得到的点云数据构建成三维模型是三维重建技术的一大主流方向。线激光扫描重建技术在逆向工程、文物和艺术品数字化存档、缺陷检测等方面有诸多应用。因此,对三维扫描技术的研究与完善具有重要意义。本文主要对基于多线激光的手持式三维扫描重建装置和方法进行了研究。首先,本文分析了基于多线激光的手持式三维扫描
我国的垃圾焚烧发电的技术处于起步阶段,相关项目的发展时间不长,推广PPP模式还需要解决一系列的技术问题,在实际的应用过程中也出现了许多问题需要克服。第一,使用PPP模式并不能解决所有项目的所有问题。这种模式将特许期拉长会导致项目的不确定性增大,再加上参与人数众多,风险也被进一步放大和增加。其次,目前垃圾焚烧行业对PPP应用中的风险本身也缺乏明确的认识和合理的认知,相应的风险管理体系尚未建立,无法为
自原油商业化以来,其定价方式发生多次转变,并且随着原油期货的推出,原油也逐步金融化。此时的原油市场开始与其他商品市场乃至金融市场存在波动关系。随着原油金融化,原油市场更加成熟,原油价格受市场供需关系的影响也越来越大,原油期货价格也逐渐成为原油价格基准。原油与金融市场之间的联系日趋紧密,特别是在新冠爆发以后,原油市场所接收金融市场的风险溢出显著增加,2020年4月21日WTI负原油期货便是最明显的体
移动互联网时代信息传播技术飞速发展,移动应用与智能设备被普遍应用,这对老字号品牌来说既是机遇也是挑战。老字号不仅有巨大的商业经济价值,更包含着丰富的历史文化底蕴,是中国品牌的重要组成部分。然而,现在老字号企业缺乏行之有效的品牌传播策略使得老字号的经营每况愈下。在新时代如何使老字号获得生机?值得我们去探索。扬州百年老字号“谢馥春”是中国第一家化妆品企业,历史最早可追溯至清道光十年,几经改制、不断探索
伴随着经济发展全球化的浪潮,跨国并购成为了我国企业实现快速扩张、提升核心竞争力的强有力手段。跨国并购深入贯彻落实我国推行的“引进来,走出去”的发展战略,能够在短时间内让国内企业与被并购企业的资源实现整合,进而提高公司业绩。受到“一带一路”倡议等的影响,我国企业走出国门进行跨国并购的次数与数量得到了显著提高。而作为本文的研究对象东山精密,其有着十分丰富的并购经验。因此,对东山精密进行案例研究对当下中
研究背景与目的:骨质疏松症是我国高发疾病之一,且近年发病率逐渐上升,其并发症不但危害患者健康,而且加重了个人、家庭以及社会医疗的负担,早期发现骨量异常流失并通过有效干预能提高患者的生存质量和生存年。作为一种光学分子诊断技术,拉曼光谱已被应用于一些系统性疾病的诊断。已有相关学者采用尿液样本研究拉曼光谱对骨质疏松症的诊断,得出拉曼光谱能用于区分骨量异常,但在更进一步鉴别骨质疏松症与骨量减少样本时较困难