基于OCR技术的涉密文档监控系统设计与实现

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:yangjianguo20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络高度发达的信息化时代,机密文件的安全保护与监控是一项非常值得重视的任务,尤其对政府、军队和其他重要单位。数字信息高速发展的今天,绝大部分文件都以电子文档的形式存在,但目前关于电子文档的安全监控系统大部分是针对计算机可以直接识别的计算机文字而设计,而对图像形式的电子文档的监控暂时还没有很好的系统对其处理,因此开发一个能对图形电子文档进行监控的系统以防止信息以图形化形式泄露,具有重要意义。通过阅读大量相关文献和参考其他相关系统的基础上,重点针对图形文档的安全监控,利用开源的OCR(Optical Character Recognition)技术,提出基于OCR技术的文件监控系统的设计与实现。大数据时代如何在大量的数据中发现价值,是目前研究的热点与重点。在大量的文件中查找机密文件也是一种价值的发现,目前对大数据处理最常用办法即采用机器学习的办法。机器学习是当前实现人工智能的最有效方法之一,为了使系统具有监控全面性、准确性、先进性、高效性甚至智能性,本项目将OCR应用技术与机器学习相结合来共同完成对机密文档的监控。项目的实现按软件工程的步骤逐步进行,首先进行需求分析,其次根据需求分析中的功能模块进行详细设计,到最后的编码实现与测试。通过测试证明基于OCR技术的涉密文档监控系统具有一定的先进性和适用性。该系统的应用能弥补对局域网中图形化形式存储的机密文档监控不到位的问题,能较全面的对文件系统进行监控,提高文档的安全性,降低信息泄露的风险。
其他文献
目的:观察丁苯酞对脑缺血再灌注大鼠脑组织胰岛素样生长因子(IGF-1)表达的影响。方法:将50只SD大鼠随机分为假手术组(n=10)、脑缺血再灌注组(n=20)及丁苯酞治疗组(n=20),脑缺血再灌注组
目的:验证电针结合天麻素对局灶性脑缺血大鼠额叶皮质生长相关蛋白-43(Growth-associated protein,GAP-43)和突触素(Synaptophysin,SYN)表达是否有协同增效作用。方法:SD大鼠
简牍作为中国古代重要的一种书写材料,保存了丰富的历史文化信息,是我国宝贵的文化财富。简牍文献的数字化处理是简牍保护及其信息检索的重要研究内容,由于简牍图像具有干扰噪声