【摘 要】
:
距今3000多年的甲骨文字是中国目前所了解到最早的成熟文字体系,考释甲骨文字对探究汉字形成以及汉字演变过程有着重要的价值,也是认识中华古代文明的窗口。在甲骨学领域,甲骨文的考释一直是一项任重而道远的工作。经过一代又一代研究学者们持之以恒的努力,已成功识别出来约1/3的甲骨文字。截止到目前仍然有约2/3的甲骨文未知其语义,由于文字断代的原因,考释工作进展艰难。同时,传统的考释方法(如因袭比对法),研
论文部分内容阅读
距今3000多年的甲骨文字是中国目前所了解到最早的成熟文字体系,考释甲骨文字对探究汉字形成以及汉字演变过程有着重要的价值,也是认识中华古代文明的窗口。在甲骨学领域,甲骨文的考释一直是一项任重而道远的工作。经过一代又一代研究学者们持之以恒的努力,已成功识别出来约1/3的甲骨文字。截止到目前仍然有约2/3的甲骨文未知其语义,由于文字断代的原因,考释工作进展艰难。同时,传统的考释方法(如因袭比对法),研究者需要将未识的甲骨文字与已识的金文、篆书、隶书等古文字进行比较,从而识别未知的甲骨文字。传统的考释方法虽然精确度较高,但需要专业的学者且具有很深的造诣,导致进展缓慢。利用人工智能技术辅助甲骨文的考释研究,是提高甲骨文考释精度和效率的方法。随着甲骨学研究的发展,甲骨文本身数据也在逐步积累,充分利用甲骨文大数据信息将机器学习技术和传统的文字考释方法相结合,可以帮助研究者提高甲骨文考释的研究效率。基于以上的研究背景,本文主要以孪生网络和从甲骨文到楷书文字演化为基础,针对甲骨文字展开相关研究,主要包括两部分内容:论文第一部分主要包括两方面的研究内容。一是构建文字演化数据集。我们建立了一个包含甲骨文、金文、篆书、隶书、楷书五个时期的汉字图片数据集。每个汉字的演化为一组,共包含972组,4860张样本。在图像预处理方面,首先利用加权平均法进行灰度化处理。其次是分别采用水平翻转、旋转、平移、扭曲失真这四种图像几何变换方法,并利用双线性插值法将图片大小统一成105×105像素,以满足人工智能技术进行甲骨文考释的要求。二是提出了一种自适应文字演化小样本预处理方法,即自适应滤波器Adafilter算法。我们在算法中引入局部图像基分解算法和黑盒优化算法。通过计算数据集的局部图像基,并将这些局部图像基与优化系数的线性组合,将预处理滤波器的优化问题转化为低维优化问题。我们的实验表明,Adafilter滤波器最大限度地提高了作为预处理滤波器的预期泛化性能。论文的第二部分对文字的5个发展过程中的演化规律做了研究。首先,我们提出了VGG-Siam文字演化网络模型。该网络模型在VGG16和孪生网络的基础上做了三方面优化。主要表现在如下三个方面:(1)我们基于卷积层定义了文字演化的数量和字形序列的长度以提高学习特征的识别能力。在文字演化数据集中依靠不同的结构学习特征向量,以实现对甲骨文到楷书这段时期的汉字演化规律。(2)我们利用文字演化数据集的离散属性,定义文字演化距离公式。(3)我们将问题转化为二分类问题,定义文字演化损失函数可以避免在进行梯度下降计算的时候出现梯度弥散。我们的研究结果表明VGG-Siam模型有着高F1值优于普通的孪生网络模型。在此基础上,我们对汉字整体演变规律的影响进行了较为系统的研究。首先对相邻的文字演化时期之间的文字进行分析,在预测过程中,甲骨文字到金文的准确率为79.25%,金文到篆书的准确率为75.24%,篆书到隶书的准确率仅为41.53%。而从隶书到楷书的准确率为80.13%。隶书到楷书的准确率最高,篆书到隶书的准确率最低。其次我们对汉字的整个演化时期的四大规律简化、繁化、同形异义和讹变进行分析,在整个文字演化预测过程中,讹变在整个文字演化的相似度最低。本文的研究结果可为计算机技术破译甲骨字的语义提供重要的研究思路和数据支持。
其他文献
半导体量子点(QDs)因其独特的光电性能,在照明和显示领域具有广阔的应用前景。以量子点为关键材料构筑的量子点发光二极管(QLEDs)具有色纯度高、色彩稳定性好、色域宽广、寿命长等优势,有望成为下一代主流的显示与照明技术。QLEDs器件的常用制备方式是以溶液转移为基础的印刷方法。基于溶液转移的印刷法包括旋涂法、转印法、刮涂法、LB技术以及喷墨打印法等,这些方法在薄膜材料的制备上各具优势,但存在仪器设
胶体量子点(QDs)具有荧光量子产率高,发光光谱窄,发光峰位可调,寿命长等优良光学性能,是量子点发光二极管(Quantum dot Light-Emitting Diodes,QLED)的核心材料。QLED器件有望发展成为下一代照明、显示技术的主流器件。目前溶液法是低成本、大面积构筑高性能QLED器件的主要方法,包括旋涂法、喷墨打印法、转印法等,其中喷墨打印是极具发展潜力的大面积制备技术,但目前在
随着社会经济快速发展,人们对能源的需求不断增加,传统化石燃料过度开发使用从而引发二氧化碳(CO2)大量排放,引起的温室效应是导致全球气候变暖的重要原因。实现CO2转换和固定,既能缓解温室效应,又能将其以碳源的形式储存下来,节约能源,助力实现碳中和。电化学催化还原CO2(CO2RR)能够在较低的电压下实现与CO2分子发生电子交换,活化稳定的CO2分子,是一种有效的转换技术正在被广泛研究。因此,利用清
随着未来社会发展对清洁可再生能源的迫切需求,环境友好、成本低廉的光伏能源备受关注,并进入蓬勃发展时期。由Zn原子和Sn原子共同取代Cu(In,Ga)Se2(CIGS)太阳能电池中的稀有元素In(Ga)原子的Cu2Zn Sn(S,Se)4(CZTSSe)太阳能电池因其丰富的元素组成、良好的环境耐受性和长期的稳定性等优点引起科研人员极大的兴趣。目前,用溶液法制备的CZTSSe薄膜与真空法制备的薄膜相比
电致变色器件在外加电压的作用下其颜色发生可逆、稳定的变化。电致变色器件因其低功耗、颜色可调节而具有广泛的应用前景,如:电子标签、防眩目后视镜、军事伪装等前沿领域。器件性能很大程度上由电致变色材料决定。经过几十年的发展,研究者已开发出过渡金属氧化物、有机小分子、导电聚合物和金属-超分子等多种类型材料。特别地,金属-超分子因具备有机材料的易加工性和颜色可调性以及无机材料的稳定性而受到研究者的广泛关注。
基于半导体量子点的发光二极管(QLED)因具有色域范围更广、色纯度和稳定性更高、能耗更低等优势,逐渐成为照明显示领域研究的一大热点。经过近三十年的发展,QLED的整体性能(如亮度、外量子效率、工作寿命)得到极大提高,目前红、绿、蓝三基色QLED的最大EQE和亮度分别达到30.9%和3300000 cd/m~2,23.9%和1680000cd/m~2,20.2%和88900 cd/m~2,并且红色和
量子点具有量子产率高、单色性好以及发射光谱连续可调等优异的光学性质,因此被广泛应用于照明及显示等多个领域。其中,量子点发光二极管(QLEDs)作为其一个重要的应用方向倍受关注。InP量子点是一种安全低毒的-族半导体纳米材料,有着与Cd Se量子点类似的优异光学性质,在纳米光电器件方面有重要的应用前景。但是受限于现有的合成技术,所制备的InP量子点晶核表面存在较多的缺陷并且稳定性较差,严重阻碍了In
锂金属具有较高的理论比容量(3860 m Ah g-1)以及较低的还原电位(-3.04 V相对于标准氢电极),是新能源电池能量密度突破500 Wh Kg-1的关键性候选材料,被视为下一代的高能量密度电池的“圣杯”负极。然而,在锂金属负极实际应用过程中存在着循环稳定性差、库伦效率低等一系列问题。造成上述问题的根本原因:一方面是锂金属负极与电解液存在着严重的副反应,导致不稳定固态电解质层不断生成、破裂
构建原子级催化剂是减少金属用量,降低催化剂成本,优化催化性能的重要方案。作为原子级催化剂的研究热点,单原子催化剂(SAC)通常是指过渡金属(TM)以单原子形式均匀分散并稳定固定在载体表面构成活性中心的催化剂。由于100%的金属利用率,SAC对于降低金属用量和催化剂成本具有重要意义。另外由于孤立的活性位点以及活性位点独特的电子结构,与传统金属纳米颗粒相比SAC对于很多重要反应具有很高的活性、选择性和
近年来,随着新能源的兴起,含量丰富、不受地域制约、环保清洁可循环的太阳能受到科研工作者的广泛关注,其中无机薄膜太阳能电池家族取得了巨大的进展。由铜铟镓硒[Cu(In,Ga)Se2,CIGSe]太阳能电池演变而来的铜锌锡硫硒[Cu2Zn Sn(S,Se)4,CZTSSe]太阳能电池,因其具有低成本、无毒、元素含量丰富等优点引起研究人员的极大兴趣。然而,CZTSSe太阳能电池目前的世界最高认证效率只有