动态概率深层特征学习与应用研究

来源 :西安电子科技大学 | 被引量 : 2次 | 上传用户:wodeblog1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络在图像识别与检测,自然语言处理,生物信息表示等多个领域取得了关键性的突破和优越的性能,使得它受到工业界与学术界的共同关注。然而,现有的深度网络普遍具有“黑盒”问题,即用户无法理解甚至信任网络所作出的决策,这限制了它的发展和应用。与深度网络相比,概率模型得益于对观测数据的先验知识以及生成过程的概率化建模,模型参数具有明确的实际意义,具备良好的可解释性,而这些特性也正是实际系统所亟需的。因此,本论文致力于将概率模型应用于不同的实际场景,针对不同问题构建多种结构的概率深度模型,并重点研究概率动态模型及扩展。此外,本论文还针对概率深度模型提出精准且快速的推理方法,并与深度网络结合,在具备可解释性的前提下提高模型性能。主要内容概括如下:1.概率深度模型被广泛用于文档分析中,以提取语义信息并获得描述性主题。为了得到可分且多样的主题表示,我们首先提出了深度多样的隐狄利克雷分配模型(deep diverse latent Dirichlet allocation,DDLDA),一个通过引入共享主题来减少通用词和无意义的词影响,进而产生更有意义的语义主题的深层主题模型。此外,我们还开发了针对DDLDA的变分推理网络,这帮助我们使用最大余量原理这一分类标准,将DDLDA进一步扩展为称有监督的深层主题模型,并称之为最大间隔深度多样的隐狄利克雷分配模型(max-margin deep diverse latent Dirichlet allocation,mmDDLDA)。与DDLDA相比,mmDDLDA可以发现更具有区别性的主题表示形式。实验结果表明,DDLDA和mmDDLDA在发现高区分性的主题表示并实现高精度文本分类方面比现有的非监督和监督主题模型更有效。2.递归神经网络(recurrent neural network,RNN)作为最常见的时序模型,它在所有时刻输入之间共享相同的参数,这使得它忽略了不同时刻输入之间的非平稳的时序关系,进而难以解决复杂多样的时间序列建模问题。鉴于此,我们给出了带有高斯混合模型的张量循环神经网络(tensor recurrent neural network with Gaussian mixture,GmTRNN),并应用于HRRP特征建模与识别任务。GmTRNN不仅可以建模时序特征,而且还可以对时刻之间变化的不同模式进行建模。此外,为了利用非参贝叶斯的方法处理概率混合模型中未知数量的混合组分,我们进一步提出了带有狄利克雷混合过程的张量循环神经网络(tensor recurrent neural network with Dirichlet process mixture,DPmTRNN)。为了将聚类过程和识别识别过程联合训练,我们提出了有效的混合在线变分推理和随机梯度下降方法。在基准数据,实测和模拟的HRRP数据上进行的实验证明了我们模型的有效性和高效性,以及对HRRP平移敏感性的鲁棒性。3.为了更好地分析顺序观察到的多元和复杂计数数据,我们提出了一种称为开关泊松伽玛动态系统(switching Poisson gamma dynamical systems,SPGDS)的开关概率动态模型。与以前的模型不同,SPGDS将其隐变量设置为服从混合伽玛分布的参数,以对复杂序列进行建模并描述非线性的动态特性,同时捕获多样的时序相关性。为了保证模型高效地推理,我们开发了可扩展的随机梯度-马尔科夫链蒙特卡罗(stochastic gradient Markov Chain Monte Carlo,SG-MCMC)和开关循环变分自编码网络联合推理方法,该推理可处理大规模计数序列,并且对新数据可以快速进行预测。在无监督任务和有监督任务上的实验表明,所提出的模型不仅对复杂的动态序列具有出色的拟合和预测性能,而且还可以分离其中的不同动态模式。4.为了建模时间序列中的双向时序相关性,我们提出了双向深层泊松伽马动态系统(bidirectional deep Poisson gamma dynamical system,bi-DPGDS),并应用于HRRP特征提取与目标识别。所提的bi-DPGDS是一个双向的概率深度动态模型,它利用层次化的伽马分布构建深层时序结构。为了进行高效地推理和库外样本的快速测试,我们通过引入一个可以融合双向的时序关系的双向循环变分推理网络,将bi-DPGDS扩展为双向循环伽马置信网络(bidirectional recurrent gamma belief network,bi-rGBN)。另外,我们通过将SG-MCMC和变分推理方法融合,提出了一个联合贝叶斯推理方案。此外,针对有监督学习,我们进一步提出了具有注意力机制的 bi-rGBN(attention bi-rGBN,attn-bi-rGBN)。在实测 HRRP 数据上的实验结果证明了我们的方法在分类和生成任务上的有效性和高效性,以及它在HRRP平移敏感性和数据量变化上的鲁棒性。5.将动态-卷积结构融入概率建模,我们提出了卷积泊松伽马动态系统(convolutional Poisson gamma dynamical systems,conv-PGDS),并应用于文本建模。conv-PGDS通过单词级卷积捕获短语级主题,而句子级的转移则捕获主题在连续句子间的转移与演变方式,最终将文档中所有句子的主题比例分布作为文档特征表示进行汇总。为了同时考虑前向与后向的时序信息传输,我们进一步开发了双向卷积泊松伽马动态系统(bidirectional Poisson gamma dynamical systems,bi-conv-PGDS),以合并完整的上下文信息来表示每个句子。为了进行有效的推理,我们构建了一个双向卷积循环推理网络,该网络同时提供句子级和文档级的表示,并引入了一种混合贝叶斯推理方案,该方案将SG-MCMC和编码变分推理进行了有效的融合。在各种文档语料库上的实验结果表明,所提出的模型可以提取表征能力更强的多级潜在表示,并在具有存储和计算效率的条件下实现了目前最优的文档分类性能。
其他文献
目的 探讨中国超声甲状腺影像报告和数据系统(C-TIRADS)、超声造影(CEUS)、BRAFV600E基因对TBSRTCⅢ类甲状腺结节诊断价值。方法 选取术前细胞病理诊断为TBSRTCⅢ类并有术后病理的甲状腺结节120例,均行CEUS、BRAFV600E基因及超声C-TIRADS分级,比较3种方法单一或联合诊断效能。结果 单一诊断方法:C-TIRADS灵敏度及准确率高于CEUS(P<0.05)及
期刊
期刊
设施葡萄是发展高效农业的重要途径,近年来我国设施葡萄产业面积稳居世界第一位,设施葡萄园出现的土壤质量退化、果品质量下降等问题阻碍了设施葡萄产业的健康发展。本文通过田间调查和室内分析不同种植年限设施栽培葡萄园土壤的理化性质、生物学特性等状况及变化趋势;采用盆栽试验研究发酵液调控改善设施障碍土壤的效果与机制;采用大田试验,研究化肥减量配方施肥条件下发酵液对设施葡萄果实糖代谢等果实品质的影响。通过以上研
学位
研究背景糖尿病肾病(Diabetic kidney disease,DKD)是最常见的糖尿病慢性并发症,是慢性肾脏病(Chronic kidney disease,CKD)以及终末期肾病(End-stage renal disease,ESRD)的最主要原因之一。尽管目前的治疗措施,包括严格控制血糖、血压、血脂和限制蛋白摄入等,以及一些新型药物,对于延缓DKD的发生发展有一定的作用,但DKD发病和
学位
研究目的:小学生体质健康关乎国家的未来。当前我国小学生的身体基本发育水平有了很大提升,营养状况也得到了改善,但是患近视等情况不断增加,儿童青少年新发近视率明显上升、视力健康整体水平不容乐观。运动视觉训练对于提升机体视觉能力具有重要作用,本文构建一套符合小学生身心发展规律的运动视觉训练方法,目的在于通过探索新的运动训练方式,切实有效的提高小学生视力,并为视力保护提供方法参考。研究方法:1)文献资料法
会议
党的十八届三中全会公报《中共中央关于全面深化改革若干重大问题的决定》明确提出要求:“探索编制自然资源资产负债表,对领导干部实行自然资源资产离任审计。”而在各类自然资源当中,矿产资源是人类生存和发展的物质基础,具有重要的战略价值和经济价值,首当其冲应当编制相应的矿产资源资产负债表。那么,核算矿产资源并编制相关报表需要面临和解决三个关键问题:一是对矿产资源进行核算和编制矿产资源资产负债表等报表的必要性
学位
由于自然禀赋因素和先进技术的缺乏,许多撒哈拉以南非洲国家的经济很大程度上依赖于矿产资源和农产品的出口。在过去的几十年中,与全球其他地区相比,资源丰富的撒哈拉以南非洲国家设法收取了很大一部分矿产租金。在很大程度上,这些国家贸易活动的增长是由不断发现和开采新的矿产和其他自然资源驱动的,如果管理得当,这些资源将被视为经济增长和繁荣的主要驱动力。但是,腐败是撒哈拉以南非洲国家最严重的问题之一,对这些国家的
学位
能源危机和环境问题日趋突出,严重制约着我国经济的可持续发展。辊道窑作为陶瓷生产过程中的能源消耗“大户”,对其能耗研究和余热资源回收利用具有重要的现实意义。现有的针对辊道窑能耗研究很少涉及到能量“质”的分析,能量退化实质及(火用)损分布规律未得到充分挖掘。在辊道窑余热资源回收利用方面,循环系统的热经济性能、环境性能和非设计工况性能等方面未得到深入的研究,缺乏对循环系统较完整的理论评估体系。基于此,本
学位
统筹推进“双碳”目标的实现和保障能源安全是中国今后相当长时期的重要战略任务。煤炭减量替代是实现“双碳”目标的必然选择,而可再生能源在短期内难以成为主体能源,且大规模发展也受诸多因素制约,油气资源(尤其是天然气)作为相对清洁的化石能源,能够为实现“双碳”目标和保障能源安全发挥重要作用。然而,中国油气资源开发利用也面临常规油气资源贫乏、海外进口受地缘政治风险影响较大、非常规油气资源开发的科技支撑不足和
期刊
基于传热学原理初步确定沥青路面高温温度场影响因素,然后利用SPSS软件对沥青路面温度与影响因素之间相关性进行分析,根据分析结果选择与沥青路面温度具有较高相关性因素作为输入变量,最后分别采用长短期记忆网络LSTM(Long Short-Term Memory)、BP神经网络和传统回归方法,建立高温期沥青路面温度预测模型。结果表明,气温、太阳辐射强度、相对湿度、地面气压、路面深度与路面温度具有较高相关
期刊