基于OCR技术的涉密文档监控系统设计与实现

来源 :电子科技大学 | 被引量 : 6次 | 上传用户：yangjianguo20

【摘要】

：

网络高度发达的信息化时代,机密文件的安全保护与监控是一项非常值得重视的任务,尤其对政府、军队和其他重要单位。数字信息高速发展的今天,绝大部分文件都以电子文档的形式

【作者】

：

徐建文

【出处】

：

电子科技大学

【发表日期】

：

2014年01期

【关键词】

：

监控系统 OCR 机器学习安全性 SVM 文档

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网络高度发达的信息化时代,机密文件的安全保护与监控是一项非常值得重视的任务,尤其对政府、军队和其他重要单位。数字信息高速发展的今天,绝大部分文件都以电子文档的形式存在,但目前关于电子文档的安全监控系统大部分是针对计算机可以直接识别的计算机文字而设计,而对图像形式的电子文档的监控暂时还没有很好的系统对其处理,因此开发一个能对图形电子文档进行监控的系统以防止信息以图形化形式泄露,具有重要意义。通过阅读大量相关文献和参考其他相关系统的基础上,重点针对图形文档的安全监控,利用开源的OCR(Optical Character Recognition)技术,提出基于OCR技术的文件监控系统的设计与实现。大数据时代如何在大量的数据中发现价值,是目前研究的热点与重点。在大量的文件中查找机密文件也是一种价值的发现,目前对大数据处理最常用办法即采用机器学习的办法。机器学习是当前实现人工智能的最有效方法之一,为了使系统具有监控全面性、准确性、先进性、高效性甚至智能性,本项目将OCR应用技术与机器学习相结合来共同完成对机密文档的监控。项目的实现按软件工程的步骤逐步进行,首先进行需求分析,其次根据需求分析中的功能模块进行详细设计,到最后的编码实现与测试。通过测试证明基于OCR技术的涉密文档监控系统具有一定的先进性和适用性。该系统的应用能弥补对局域网中图形化形式存储的机密文档监控不到位的问题,能较全面的对文件系统进行监控,提高文档的安全性,降低信息泄露的风险。

其他文献

丁苯酞对大鼠脑缺血再灌注后IGF-1表达的影响

目的：观察丁苯酞对脑缺血再灌注大鼠脑组织胰岛素样生长因子（IGF-1）表达的影响。方法：将50只SD大鼠随机分为假手术组（n=10）、脑缺血再灌注组（n=20）及丁苯酞治疗组（n=20）,脑缺血再灌注组

期刊

丁苯酞胰岛素样生长因子1脑缺血再灌注Butylphthalide Insulin-like growth factor 1 Cerebral ischem

电针结合天麻素增加局灶性脑缺血大鼠额叶皮质生长相关蛋白-43以及突触素的免疫组化表达

目的:验证电针结合天麻素对局灶性脑缺血大鼠额叶皮质生长相关蛋白-43(Growth-associated protein,GAP-43)和突触素(Synaptophysin,SYN)表达是否有协同增效作用。方法:SD大鼠

期刊

脑缺血电针天麻素生长相关蛋白-43突触素额叶皮质

OCR技术在简牍图像数字化中的应用

简牍作为中国古代重要的一种书写材料，保存了丰富的历史文化信息，是我国宝贵的文化财富。简牍文献的数字化处理是简牍保护及其信息检索的重要研究内容，由于简牍图像具有干扰噪声

学位

简牍文字识别二值化文字切分细化

基于OCR技术的涉密文档监控系统设计与实现

其他学术论文