【摘 要】
:
近年来,我国与马来西亚双边在经济、政治、文化等方面往来非常密切,两国语言的翻译需求日益变大。面向中马的人工翻译,成本较高,效率较为低下。在这一趋势下,机器翻译具有很大的研究意义与实用价值。当前,机器翻译模型性能优异程度取决于语料数据的数量与质量,而中马语料数据不足,使得中马机器翻译模型性能难以提升。本文提出基于迁移学习与基于GumbelTree-LSTM优化的中马机器翻译模型,缓解语料不足带来的性
论文部分内容阅读
近年来,我国与马来西亚双边在经济、政治、文化等方面往来非常密切,两国语言的翻译需求日益变大。面向中马的人工翻译,成本较高,效率较为低下。在这一趋势下,机器翻译具有很大的研究意义与实用价值。当前,机器翻译模型性能优异程度取决于语料数据的数量与质量,而中马语料数据不足,使得中马机器翻译模型性能难以提升。本文提出基于迁移学习与基于GumbelTree-LSTM优化的中马机器翻译模型,缓解语料不足带来的性能欠佳问题,并进一步融合上述模型实现中马机器翻译原型系统。本文主要研究工作如下:(1)中马平行语料数据的收集与处理。以中马语料为对象,设计一种基于Python的网络爬虫算法,通过语料收集、关键字提取、数据预处理等步骤,设计并构建中马平行语料数据集。(2)通过枢轴语言的思想,提出了基于迁移学习的中马机器翻译模型方法。在训练语料更丰富的中英和英马NMT模型的基础上,通过迁移共享枢轴语言模型参数,对中马NMT模型参数进行初始化,学习高资源语言知识,提高低资源的中马机器翻译模型的翻译性能。将英语作为枢轴语言,减少模型参数迁移时语言不同导致的影响。实验结果表明,基于迁移学习的方法有助于提升模型翻译效果。(3)提出了基于Gumbel-Tree-LSTM模型优化的中马机器翻译模型。通过Gumbel-Tree-LSTM对Bi-LSTM模型进行优化,学习源句子的树形结构,使用树向量作为上下文信息,增强模型理解中长距离字词语义关系的能力。实验结果表明,本文基于Gumbel-Tree-LSTM模型优化方法有助于提升模型翻译效果。(4)基于上述研究,设计了融合迁移学习与Gumbel-Tree-LSTM的中马机器翻译原型系统。结合两者的优点,联合训练得到性能优秀的中马机器翻译原型系统。该系统可作为测试平台,进一步研究如何将更多技术通过中马神经机器翻译框架进行融合。
其他文献
近年来,虽然装配式建筑得到了快速发展,建造水平和建筑品质也得到了明显提升,但当前装配式建筑仍存在诸多问题,这就要求我们要用工业化的思维发展装配式建筑,把建筑当作“工业化产品”来打造。标准化设计是实现工业化的基础,一体化协同是实现工业化的核心,数字化管理是实现工业化的保障,只有这样才能真正做好装配式建筑。
自推行住房商品化制度以来,我国房地产市场快速发展,房价持续上涨。近年来,城市间房价差异逐渐拉大,房价分化态势愈发明显,引起了全社会的密切关注,正确认识和对待房价分化问题,探究其中的规律性具有一定现实意义。与此同时,频繁的人口流动现象是当今社会的重要特征。第七次全国人口普查数据显示全国约有3.8亿的流动人口,相比2010年上涨了69.73%,形成了明显的人口流动趋势。通常认为人口流动将影响到地区房价
当前,在我国经济发展步入新常态的背景下,老龄化进程不断加速,这对我国财政收入和财政支出等产生了巨大冲击,而这些冲击最终表现为地方政府能否实现财政可持续性。就收入端而言,一方面,人口老龄化意味着适龄劳动人口减少,会通过削弱个人所得税的税基减少财政收入;另一方面,老龄人口增多会带动银发经济等产业的发展,扩大商品税税基,增加政府的财政收入。就支出端而言,一方面,人口老龄化减少了劳动供给数量,使个人所得税
党的基层组织是党赖以生存和发展的根本,党的基层组织建设的成败直接决定着党的建设的成败。在国共两党历史上,抗战时期是两党快速发展的时期,也是两党基层党的建设的成败关键期。通过对抗战时期国共两党基层党建的全面考察和对比分析研究,本文认为:中国共产党之所以能在抗战中不断发展壮大,主要是因为建立了自上而下集中统一的组织管理体系,党的基层组织建设坚强有力,在动员群众、团结群众、凝聚群众方面充分发挥了战斗堡垒
采用高中物理教学反思方式学生理解得更透彻,知识掌握得更牢固,同时也学会了分析和解决问题的一般方法。
对于大部分高中生而言,高中物理是一门难以学习与掌握的学科,很多学生在没有真正开始接触物理之前就被物理很难的言论吓倒了,对于物理的学习存在畏惧心理,对自己不自信,不能积极面对物理这一学科。对于这些现象,高中物理老师要摒弃老旧的教学方法,设计合理的教学方案,运用新颖的教学方法,打消学生对于物理的畏惧,树立学习物理的自信心与积极性,帮助学生发现物理有趣的一面,从而学好物理。
广西壮族自治区历史悠久,具有浓厚的革命文化气息,其中具有一定知名度和社会贡献的人,在其生平中形成的全部具有保存价值的各种形式的记录的集合体,就是名人档案。名人档案不仅是可供挖掘的文化资源,拥有潜在的增值效应,也是不可多得的精神财富。以发挥名人档案文化价值、实现名人档案的充分利用为目的,通过文献研究法、案例分析法与实地调研法对名人档案信息资源的开发模式进行研究,分析拉斯韦尔5W模式应用于名人档案信息
随着我国供应链金融行业不断发展,供应链金融规模持续增长,与相关产业不断融合,发展模式不断创新,拓宽了中小企业融资渠道,为促进相关行业发展和国民经济增长起到了重要作用。但是,在供应链金融业务具体运作过程中,商业银行对供应链金融服务的风险识别和风险控制成本较高,而对于供应链企业来说,上游企业不愿为下游企业做信用背书,下游企业因运营成本较高而减少订单量,供应链金融在解决融资难、融资贵方面的作用尚未充分发
数字素养与技能是数字社会公民学习工作生活应具备的数字获取、制作、使用、评价、交互、分享、创新、安全保障、伦理道德等一系列素质与能力的集合[出自《提升全民数字素养与技能行动纲要》]。全民数字素养与技能是国际竞争力和软实力的关键指标,提升全民数字素养与技能是顺应数字时代要求,更好迎接数字文明新时代的关键举措。随着《提升全民数字素养与技能行动纲要》的发布,高校图书馆馆员提升数字素养以适应社会的发展进步已