面向序列数据的深度学习算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:suddysand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展积累了大量的信息数据,其中包括体现内在关联关系的序列数据。如何挖掘序列数据关联关系并对未来进行预测,是推动人工智能发展和社会智能化的一项重要研究工作。在序列数据建模过程中,通常会遇到许多难题,如序列数据的稀疏性、时序长程依赖挖掘的困难性以及长序列信息传递推理问题等。针对这些存在的问题与挑战,本文对序列建模问题进行了深入研究,提出了一系列面向序列数据的深度建模方法,克服了传统序列建模中存在的序列间隔忽略和信息推理能力缺乏等问题。本文研究的动机是通过利用辅助信息对深度序列模型进行结构改造,以构造更合理的深度序列模型,从而运用到实际应用场景中,提升模型的预测推荐能力。具体来说,本文的主要工作可以总结为如下几个方面:针对普遍存在的序列稀疏性问题,提出了一种组合架构的长短时记忆网络模型。具体而言,在商业广告推荐领域,提出利用长短时记忆网络来分别对如下两种序列进行关联关系挖掘:反映全局关联的用户-查询语句-广告的三元关系序列(全局的长短时记忆模型)和反映局部依赖查询语句序列(局部的长短时记忆模型),以将用户的查询意图嵌入到连续向量空间,并进一步将其解码来刻画不同类型广告的概率分布,从而进行广告排序推荐。更进一步地,该方法将全局和局部的模型巧妙地结合起来构成更具鲁棒性的组合长短时记忆模型,以提高广告推荐效果。针对普遍存在的序列间隔信息忽略问题,提出了一种时空嵌入的长短时记忆网络模型。该模型指出序列节点间的间隔(如时间间隔和空间间隔等)对序列建模的重要性,并提出使用嵌入学习的方法将地点预测问题中的时间间隔以及空间间隔离散后嵌入,并将其与长短时记忆网络中的门结构有机结合在一起,一方面引入时空信息对序列的影响,一方面通过时空信息引导门机制的功能学习,缓解序列稀疏性。在此基础之上,又提出了层次架构的深度网络,来对历史序列进行层次建模,从对历史序列信息的学习中来提升对未来序列的预测性能。提出了一种基于时空嵌入的生成对抗网络(ST-GAN)模型。该模型在序列生成对抗网络的基础上,提出了时空嵌入式长短时记忆生成模型(ST-LSTM)和时空嵌入式卷积神经网络判别模型(ST-CNN),其中ST-LSTM利用时空信息来引导LSTM训练门机制,而ST-CNN则利用时空信息来增强判别访问序列真伪的能力。此外,ST-GAN的训练优化机制使得模型能够生成更多与真实数据分布相似的数据来引导模型学习,从而得到更好的预测效果。针对长程信息记忆利用及推理问题,提出了一种基于多轮跨模态注意力机制的记忆网络模型。众所周知,注意力机制能够辅助深度模型更好地找到与问题相关的事实依据。在视觉问答对话任务中,多数方法通常仅仅使用单轮注意力机制来检索关于问题的实时依据。然而,存在于对话任务中的信息传递现象使得单轮注意力机制不能很好地发挥作用。针对信息传递现象,本文提出了一种基于多轮注意力机制的记忆网络模型。在该模型中,先提出一种基于注意力机制记忆网络来分别对图像视觉信息和对话文本信息来进行有效编码存储,并将所需回答的问题同时投射到视觉记忆网络和文本记忆网络来检索多模态事实依据;然后提出一种多轮注意力机制架构来构建问题与两类记忆网络之间的多轮交互关系,从而解决存在于其中的信息传递及推理问题。本文基于从不同领域产生的真实序列数据对所提方法进行了实验验证,实验结果均证明了所提方法在实际应用场景中的有效性。
其他文献
三岛由纪夫的《金阁寺》是世界文学史上最著名的小说之一,许多翻译家进行过译介,本文研究的是由林少华翻译,青岛出版社2010年出版的汉译本。上世纪70年代,西方的译学观念发生
35kV直配电网是以35kV高压输入负荷中心,电压由35kV变为0.4kV直接供负荷的供电方式。经计算,35kV直配线路的损耗在同长度、同截面、同功率的条件下仅为6kV配电线路损耗的1/34,又因
明初著名理学教育家吴康斋的道德修养理论颇具特色,它是传统道德修养论向启蒙思想的过渡,改变了传统的道德修养方向,使道德修养工夫由传统的向外用功变为向内用功,即在心上用
为了提升高速开关阀(HSV)的动态性能,降低温升与能耗,提出基于电流反馈的高速开关阀3电压控制策略.回路中的电流能够反映高速开关阀的工作状态,通过外部的数字信号及回路中的
随着农业产业布局逐渐合理,柑桔市场从最初的暴利到现在趋于饱和。本文从成渝地区柑桔产业的生产管理问题切入,结合文献资料和154份调查问卷,对两地发展情况进行对比研究,得
期刊
随着互联网技术的快速发展,视频与图像等包含视觉信息的数据呈指数级增长。在大数据的时代背景下,如何从海量视觉数据中提取与表示具有语义信息的视觉目标,进而实现对视觉内
随着我国电力体制改革的逐步深化,业扩工程在供电企业中所占据的地位与作用也日益凸显。而作为业扩工程的一个重要环节,工程验收工作的重要性也越来越显著,其不仅关系到业扩
研究背景与目的:TLR4是一类具有较高同源性、单一性的模式识别受体,可通过识别病原相关分子模式(PAMPs)等,从而激活相应的信号传导通路(依赖/非依赖MyD88信号传导通路),进一步促进NF-κB的激活。目前研究证明,TLR4在多种恶性肿瘤组织中呈高表达状态,可促进恶性肿瘤的增殖、抑制肿瘤细胞凋亡及诱导免疫逃逸等[1-3]。NF-κB主要是由NF-κB1和RealA组成的异二聚体,参与机体炎症反
[目的]探讨以情景模拟为基础的刻意训练在培养护理本科生沟通能力中的应用效果,进而总结出一套护生临床沟通能力培训方法,为护生的人际沟通教育提供依据。[方法]将2016级护理
道光十年,安徽发现捐纳职衔者并无部案,咨取部文核对,亦与户部咨文版片式样迥异,且无捐纳者身家清白册结,凡此种种,均与捐纳之例不符,遂上奏朝廷。道光帝谕令大学士、协办大