【摘 要】
:
在科技高速发展的当今社会,各行各业的数据信息正呈指数级别不断爆发,因此有效的信息检索技术正受到人们越来越多的关注。传统的基于文档内容或者基于文档自身重要性的检索方
论文部分内容阅读
在科技高速发展的当今社会,各行各业的数据信息正呈指数级别不断爆发,因此有效的信息检索技术正受到人们越来越多的关注。传统的基于文档内容或者基于文档自身重要性的检索方法都很难满足人们对于高精度检索的要求。但这两种方法对用户需求来说却有很强的互补性,因此将各类方法进行融合作为特征,根据特征进行学习的排序学习技术应运而生。根据训练样本的不同,排序学习主要分为点级(Pointwise)、对级(Pairwise)和列表级(Listwise)三种方法。本文在前人的研究基础上,主要对Pairwise和Listwise排序算法的学习工具以及Pairwise算法的损失函数进行了研究,主要包括以下两个方面:针对已有的基于神经网络的排序学习算法随机初始化神经网络的连接权值,存在易陷入局部最优和训练时间过长的问题,提出了基于多层受限玻尔兹曼机(RBM)的排序学习算法。网络首层采用实值RBM,其余层是二值RBM。最后一层RBM网络的隐藏层节点数量为1,该节点的采样激活值作为样本的初始排序得分。通过对多层RBM的无监督预训练来初始化神经网络的连接权值。分别定义基于Pairwise和Listwise的损失函数,采用反向传播算法进行微调,得到最优模型。OHSUMED和MQ2008数据集上的实验结果表明,相比现有的基于神经网络的Pairwise和Listwise排序学习算法,该方法可以有效实现网络参数的优化,最终模型的排序准确率明显提高。现有的基于交叉熵的Pairwise算法存在的偏序文档对排序损失没有固定上界、不能进行查询级计算、没有强调排在靠前位置的文档等与信息检索评价标准不一致的问题。本文考虑存在相同标记文档对(Ties)的情况,根据概率框架,提出了一种分段有界的新损失函数,并根据不同文档对的相关性差异定义了偏序权重,采用小批量梯度下降法对算法进行优化。OHSUMED和MQ2008数据集上的实验结果表明,相比于现有的几种流行排序算法,该方法可以有效实现参数优化,最终模型的排序准确率明显提高。
其他文献
目标识别技术在视觉领域工作中是较为重要的一部分,在识别技术中较为重要的两类算法是基于灰度的匹配算法和基于特征的匹配算法。其中第一种算法的原理是通过比较两张图片中
现代电磁场数值计算方法在目标隐身技术研究、目标特性识别、雷达系统设计等领域有着重要地位。随着目前对电大尺寸目标电磁特性分析的需求,使得数值算法的加速方法受到广泛
近年来,随着全球汽车拥有量的快速增长,石油等化石燃料过度消耗造成的能源危机和尾气排放间接导致的水环境污染问题日益加剧,开发清洁能源和寻找理想的治理水污染问题的方法变得刻不容缓。目前,质子交换膜燃料电池(PEMFC)可用于应急供电,分散型供电和交通工具动力源。作为该电池的阴极反应——氧还原反应(ORR),近年来被广泛关注。贵金属Pt及其合金作为一种高效的ORR电催化活性剂,其稀有性和高昂的价格极大阻
复杂网络作为真实系统的高度抽象,为系统的研究提供了一种重要手段。现实中绝大多数系统具有异质性。网络的异质性对网络的信息传输、病毒传播、抗毁性等都有影响。网络结构
交替方向乘子法(ADMM)是凸优化问题中应用广泛的一种算法,在图像处理、机器学习、信号处理等领域发挥着重要作用.当多块可分凸优化问题中含有两组变量时,运用ADMM求解在理论
高原红细胞增多症(HAPC)是一种高原常见的慢性疾病,以红细胞过度增多为特点,严重影响着高原居民的身体健康。其发病原因是由高原低氧引起的,但发病机制尚未阐明。GATA-1作为
真核生物细胞周期是一个复杂而又高度有序的过程。包括细胞的生长、遗传物质的复制,以及将复制产生的染色体分离到其子细胞等过程。DNA复制是该过程的核心事件。细胞分化是单一细胞系经过复杂生命活动产生一系列结构功能有明显差异细胞系的过程。在分化过程中基因的选择性表达需要特异性的转录程序,而DNA的复制时序与基因的转录调控存在密切联系。细胞在分化过程中通过改变DNA复制时序使得分化后细胞的生物功能顺利实现,
背景帕金森病(Parkinson’s disease,PD)是一种神经退行性疾病,临床表现以静止性震颤、运动迟缓、肢体强直和姿势平衡障碍为主。其病理特征是中脑黑质致密部(Substantia nigr
N-糖链不管是在哺乳动物还是植物中都具有重要的生物学功能,而不同的糖链结构对其生物学功能也存在不同影响。为了研究N-糖链结构与功能的关系,首先需要将N-糖链从所连接的糖
花岗岩残积土在湖南区域内广泛分布,其受矿物成分、风化程度、粒径组成等因素影响而具有特殊的物理力学性质。持续强降雨作用下,花岗岩残积土斜坡极易发生失稳破坏,且其失稳具有较强的隐蔽性及大变形的突发性。为评估与预测该类斜坡的稳定性,丰富临界判识条件,论文从斜坡形态的稳定特征开展研究。基于花岗岩残积土的交流阻抗测试,分析花岗岩残积土物理力学特性的电化学表征关系。在此基础上,试验测试花岗岩残积土休止角,探究