【摘 要】
:
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特
【基金项目】
:
国家自然科学基金(61772440)
论文部分内容阅读
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特征表示然后计算相似性的过程。但是,传统结构特征或者图像处理进行提取特征的方法受到甲骨文因时间、地区以及篆刻力度等因素导致同一个单字的甲骨文却有多种的字形的影响,因此使得这些方法存在对图像质量要求高、方法通用性差、特征鉴别能力差等问题从而导致检索准确率低的情况;而传统的深度学习方法对训练数据集的数据量依赖性较大,但从计算机视觉的角度来看,关于甲骨字符分析的研究很少,数据分布较为零散,也没有相关的完整大型公共数据集。因此,本文采用更适合多分类、少样本的数据的孪生神经网络模型,其能够克服以上通用性差、数据集少等问题。并且VLAD能够获取有关图像上聚合的局部特征有效的统计信息,提高特征的有效性。于是,该模型由两个并行分支组成,每个分支由CNN、VLAD串行组成,图像通过CNN层提取深度描述符,再利用VLAD生成甲骨文图像的最终表示。本文的主要工作贡献可分为以下几个方面:(1)本文利用爬虫工具从网站上收集甲骨文近40,000张文字图片及其标签,这也是据我们所知,目前较大的甲骨文数据集之一。(2)本文提出了一种基于孪生神经网络的甲骨文图像检索方法,利用CNN+VLAD方法生成甲骨文图像的表示特征。通过其它方法的比较,证明该方法的有效性。(3)本文构建了基于网页平台的图像检索系统,使得本文提出的检索方法能够在实际工作中进行应用。
其他文献
磁性随机存储器因具有静态功耗低、非易失性、读写速度快等优点,引起了科研工作者广泛的关注。当前研究主要集中在如何利用面内电流激发的自旋轨道力矩诱导自由层的磁化翻转。然而,自旋轨道力矩与界面微观结构、磁各向异性等参数密切相关,使得界面对自旋轨道力矩的影响尤其是Rashba效应在磁化翻转中的作用等相关物理机制缺乏足够的理解。面内磁各向异性结构能够实现对面内磁各向异性、矫顽力、易磁化轴取向等的调控,并可以
广泛存在的细菌多药耐药性问题,使得发展新型抗生素的需求迫切。抗生素自问世以来拯救了无数生命,然而近年来抗生素滥用问题日益严峻。世界范围内新的耐药菌不断出现,当下抗生素研发步伐却放缓,上市的抗生素药物也在极短时间就发现了耐药菌株,导致抗菌治疗问题日益严峻,临床上甚至已经出现无药可用的紧迫情况。因此,急需寻找新的抗生素药物来治疗这类感染性疾病。抗菌肽(antimicrobial peptide,AMP
天然气水合物作为新型非常规清洁能源而备受关注,全球97%以上天然气水合物藏发现于大陆边缘海底沉积物中。当天然气水合物藏温压条件改变,天然气水合物将发生分解,释放向上渗漏的甲烷流体。甲烷向浅层运移过程与沉积物孔隙水中硫酸盐发生的甲烷厌氧氧化(SR-AOM)作用,最终与孔隙流体中金属离子反应形成碳酸盐和硫化物等相关自生矿物,并对自生矿物形态及结构产生影响。渗出海底的甲烷流体,经氧化将形成不同产状和矿物
目的:临床同种异体移植的成功是以终生服用药物来源的免疫抑制剂为代价的,长期使用免疫抑制剂具有较多副作用。既往的研究表明间充质干细胞(Mesenchymal stem cells,MSC)具有免疫调节功能,在器官移植中可以调节炎症的进程并改善移植物的状态,现有研究证明,MSC在体内外均有免疫调节的作用,且可以延长移植物的存活时间。此外,在临床移植中,MSC已被多次应用并证明其安全性。在本研究中,拟通
T细胞白血病1(T-cell leukemia/lymphoma 1,Tcl1)在白血病中作为原癌基因,已有文献报道Tcl1在肝癌中与戊糖磷酸途径有关。然而,Tcl1是否在结直肠癌(Colorectal cancer,CRC)的发生发展中发挥作用尚无明确报道。因此,我们研究了 Tcl1在CRC中的作用。利用蛋白质免疫印迹(Western Blot,WB)和逆转录-聚合酶链反应(RT-PCR)验证T
当前全球数字化社会建设日益成熟,云服务日渐得到个人、组织机构和大型企业的青睐,可预见未来所有的组织机构都将使用云服务。与此同时,文件共享和文件协作是近六年来使用率最高的云服务类别,这对云服务中文件共享和文件协作、以及文件同步技术提出了更严峻的挑战。针对云同步技术收到的挑战,如何提升云同步性能,为庞大的用户群体提供优质的服务是亟需解决的问题。首先,分析现有云同步技术在大规模应用云服务场景下的同步效率
21世纪进入了信息化的时代,信息化已经进入各行各业,并且信息化技术变成了当今世界上发展最迅速的产业,与此同时,人们对信息化的要求越来越高,对信息化的需求的变化日新月异。我们如何能快速完成项目的上线,如何能快速响应需求的变更一直是各个技术团队希望解决的问题。要解决这个问题,需要拥有一个高效快速的二次开发系统,能让系统更快的投入生产,更能拥抱需求的变更。而一个高效快速的二次开发系统首先系统架构上要整体
随着互联网的高速发展,越来越多的网民在社交平台发表言论,促进了世界的多元化交流。但问题也随之而来,大量的谣言也在社交平台上传播,一些涉及公共安全的谣言,更是对社会稳定造成巨大伤害。然而目前的谣言检测侧重于文本特征、用户信息以及传播结构信息,它们本质上仍然是通过分析用户的发布意图来检测文本的虚假性,却忽略了知识的重要性,在目前谣言数据集数据量少、收集困难的情况下更是影响到谣言检测的性能,因此外部知识
核电站的兴起缓解了当今的日益增长的能源供需矛盾。然而,2011年发生于日本福岛核电站的重大核事故再次使人们将目光集中在核安全的问题上,该事故暴露了燃料颗粒包壳锆合金在高温水蒸气下易发生锆水反应释氢的安全问题。基于该背景下,一种被称为“事故容错燃料”(Accident-tolerant fuel,ATF)的技术概念得以提出。在该技术概念中表面覆膜技术因其成熟的工艺和应用而受到青睐,其中非晶/晶体纳米
人们的日常生活和软件应用服务越来越无法分离。为了应对不断变化的需求,软件开发团队能够快速的对产品进行迭代变得越来越重要。随着微服务、DevOps、容器技术的逐步发展,云原生应运而生,为软件应用服务的快速迭代提供了解决思路。目前谷歌开源了 Kubernetes为容器的管理提供了帮助,但主要是作为容器的编排工具,不能够完全涵盖云原生应用从源代码到发布的整个流程。本文基于Kubernetes实现了一个云