基于异构计算的图片敏感文字检测系统

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:abeey2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下网络环境中存在大量以文字,图片和视频等形式传播的敏感信息。随着政府“净网行动”的实施,纯文本形式敏感信息传播得到了有效的遏制。许多不法分子改用图片中嵌入敏感文字的方式散播敏感信息。当前图片中的敏感文字检测存在检测难度大以及检测效率低的问题。基于以上考虑,本文设计了基于异构计算的图片敏感文字检测系统。系统可以从数据源图片获取图片并对图片进行文字定位,图片文字识别和敏感语义检测等处理。其中,为了解决复杂场景下的文字定位问题,使用了基于区域推荐网络RPN与双向循环神经网络GRU的端到端深度网络架构。在文字识别环节,为了提高系统的检测鲁棒性,设计了两层文字识别模块。第一层文字识别模块通过CNN,深层双向GRU网络与CTC网络对大部分文字进行识别。针对第一层文字识别评分较低的图片,使用开源引擎Tesseract进行了第二层文字识别处理。在敏感语义检测环节,本文设计了两层敏感语义过滤器。其中第一层过滤器通过使用前缀树方式对输入语句进行敏感词粗过滤。第二层过滤器通过使用中文分词,词袋和SVM分类器的方式进行深层次的敏感语义过滤。为了解决网络图片数量巨大,纯软件处理时间长的问题,本文根据系统算法的类型,并行特性和功耗等因素,选择了基于FPGA的异构计算系统进行系统实现和关键算法加速。通过OpenCL框架在异构系统中进行了任务分配和调度,通过FPGA端的加速内核对系统耗时较长并行度较高的部分进行了加速处理。测试结果表明,本文系统在以网页为单位进行检测时,检测准确率可达约95%。以图片为单位时,处理速度可达约1.4 s/张。相较于CPU方案,本文FPGA解决方案在处理速度上有近6倍的提升,在能效比上有近37倍的提升。本文系统可以同时满足图片敏感文字检测问题对有效性与及时性的要求。
其他文献
以活性碳(Vulcan XC-72)为载体,用改良的化学还原法制备不同Pd:Cu比例的Pdx-Cu/C催化剂,使用X-射线衍射(XRD)、透射电镜(TEM)、X-射线光电子能谱(XPS)和电化学方法对其进行了表征,研
目的:探讨阑尾炎诊断中多层螺旋CT临床应用价值。方法:回顾性分析60例阑尾炎患者的CT特征。结果:60例患者,术前多层螺旋CT诊断急性单纯性阑尾炎14例、急性化脓性阑尾炎19例、
近几年,社区戒毒工作在具体实施过程中效果显著,在专职管理的基础上,做到了人力、物力资源的最大化,对我国的禁毒工作,尤其是对吸毒成瘾人员的戒毒及回归社会工作具有重大的
目的研究预防气管切开患者经外周静脉置入中心静脉导管(PICC)置管过程中发生颈内静脉异位的新方法。方法选择2009年2月—2014年11月在广州军区广州总医院采用超声引导行PICC
需求追踪管理是核电厂安全级DCS系统开发与软件V&V的重要任务。本文基于DCS系统分布式架构的特点,以系统需求与DCS系统架构为基础,将需求分配到不同的子系统中,建立"需求—子
用两相界面法合成一系列不同含量的稀土La掺杂的ZnO纳米粒子,然后用三氯乙酸对ZnO纳米粒子进行表面活化并与酸处理后的硅藻土混合,用溶胶凝胶技术制备了改性ZnO/硅藻土复合材
目的探讨2010—2012年北京市C区城镇职工医疗保险参保人口及基金运行情况。方法 2014年3—6月采用描述性统计方法对2010—2012年北京市C区城镇职工医疗保险的参保人口情况、
目的探讨经颅磁刺激神经调控治疗在肌张力低下型脑性瘫痪患儿康复中的作用。方法选取2014年6月—2015年3月徐州市儿童医院收治的肌张力低下型脑性瘫痪患儿57例为研究对象,采
<正>妊娠母猪处于养猪生产的重要阶段,其饲养管理工作,对保障前期配种工作的成果及保证后期母猪繁殖力的延续都起着相当大的作用。在此阶段,饲养管理工作主要包括:早期妊娠诊
目的探讨全面无反应性量表(FOUR)评分对颅脑损伤患者90 d预后的评估价值。方法选择皖南医学院附属黄山市人民医院重症医学科(ICU)2014年1—10月收治的颅脑损伤患者为研究对象