【摘 要】
:
在英语作为事实上的世界语、全球教育在线共享的大环境下,英语教学是个趋势。由于教育领域专有名词偏多,且英语存在口音差异,因此课堂字幕对于增强英语教学效果非常重要。人工智能技术的发展加速了字幕自动生成技术的进步,但目前面向英语课堂教学的字幕生成的研究较少。本文以英语课堂教学的字幕生成为研究内容。目前在教育领域还没有公开的语音数据集,而语音识别的效果与特定领域有关,教育领域数据集的稀缺会影响语音识别的效
论文部分内容阅读
在英语作为事实上的世界语、全球教育在线共享的大环境下,英语教学是个趋势。由于教育领域专有名词偏多,且英语存在口音差异,因此课堂字幕对于增强英语教学效果非常重要。人工智能技术的发展加速了字幕自动生成技术的进步,但目前面向英语课堂教学的字幕生成的研究较少。本文以英语课堂教学的字幕生成为研究内容。目前在教育领域还没有公开的语音数据集,而语音识别的效果与特定领域有关,教育领域数据集的稀缺会影响语音识别的效果。与在线视频字幕生成的任务不同,视频字幕进行标点符号等处理并非必要,而在课堂现场教学时,为了使学生能清晰阅读、理解教学内容,对字幕进行标点等后处理工作是必不可少的。鉴于以上分析,我们展开了以下几项研究工作:(1)针对教育领域公开数据集稀缺的问题,构建了一个包含视频、音频、文本的多模态数据集Khan,并在该多模态数据集上进行语音识别模型的训练和对比实验,结果表明该数据集对于提升教育领域的语音识别效果有所帮助。(2)将基于自注意力机制的序列切分模型应用于标点预测任务上,并在多模态数据集上使用音频信息和文本信息相结合的方法提升标点预测的效果。分别在IWSLT2012公开数据集、自建新闻数据集和多模态数据集Khan上进行对比实验,实验证明我们的方法在不同领域的数据集上具有通用性。(3)将基于自注意力机制的序列切分模型用于段落分割的任务。在数据集Khan上进行实验评估表明我们的方法对教育领域文本的段落分割的有效性。总之,本文提出的面向课堂教学的字幕生成工作具有较大的研究价值,我们创建了多模态数据集Khan并将自注意力机制用于句子标点预测和段落分割,对面向课堂教学的字幕生成这一课题进行了深入的研究。
其他文献
采用水热法制备了纳米赤铁矿吸附剂,对不同pH值?吸附剂用量、吸附时间和初始U(VI)浓度下纳米赤铁矿吸附剂吸附低浓度U(VI)的行为进行了研究,并采用XRD、SEM和EDS对纳米赤铁矿
在我国人力资源服务行业和知识经济高速发展的时代背景下,“以人为本”成为现如今企业经营和发展的根本立足点和出发点。国际很多大型企业为抓住市场竞争主动权,纷纷把人力资
全球化的推进势不可挡,广泛的国际交流日益频繁。国际理解的教育已经引起了越来越多的关注。目前,我国各地开展的国际理解教育,主要是通过各种学科教学活动进行渗透。小学英语教学本身就有着传递各民族之间的信息,学习各国礼仪和文化、增进对世界各民族的理解、传递世界真实信息的作用,这与国际理解教育的内容不谋而合。成都天府新区第一小学地处国家级新区——成都天府新区的核心地带,周围是知名的国内国际企业和公司,国际融
时令茗茶从春天发芽到霜降前,按不同节气采茶,用茶截取时令变化的偏性,以茶之偏性纠人身心之偏,使之平衡。$$ 绿茶$$ 绿茶是原汁原味的茶。如果说花茶是梳妆打扮,香气沁人的
中国共产党十九大明确要加快生态文明体制改革,要提供更多优质生态产品以满足人民日益增长的优美生态环境需要,必须形成节约资源和环境保护的空间结构、产业结构、生产方式、生活方式。运河经济带的生态环境保护具有特殊性,主要是因为经济带基本依靠运河相连,水生态的环境污染具有较强的传播和扩散性。江淮运河南连长江北接淮河,为皖北地区提供生产生活用水是江淮运河的重要任务,但是运河经流水污染较重的巢湖和以传统工业为主
<正>在几乎整个社会都在关注传统的经典的艺术,关注成熟的知名的画家的同时,我们有必要将目光投向20世纪七、八十年代出生的青年艺术家,他们已经成为青年美展中的主力军, 也
‘红锦富’是‘长富2号’富士苹果的早熟芽变新品系,与‘长富2号’相比果实成熟期提前约45 d,早果,丰产,稳产,适应性强,果形端正,萼洼处果锈少,耐贮性好.
为了适应当前教育改革和人才发展的需求,结合历史学科的特点,新课标提出了历史学科五大核心素养。其中,史料实证素养是诸素养得以达成的基本方法,不仅顺应了课程改革的需要,
据国内媒体透露,工信部将于近日牵头多部委启动淘汰落后产能的检查工作,并根据检查结果修订《淘汰落后产能指导目录》。工信部相关人士透露,2012年淘汰落后产能工作重点将新增“