【摘 要】
:
正标记和未标记学习(Positive and unlabeled learning,PU学习)的研究是为了解决只有正标记样本和未标记样本可用的问题。以前针对该问题的研究大部分工作都是致力于从未标记的数据中识别负样本,因此主要是应用监督学习方法来构建分类器。但对剩余的未标记数据,要么将它们排除在学习阶段,要么强行将它们归属于某一类,这极大限制了PU学习算法的性能。此外,先前的PU方法一般都假设训练实
论文部分内容阅读
正标记和未标记学习(Positive and unlabeled learning,PU学习)的研究是为了解决只有正标记样本和未标记样本可用的问题。以前针对该问题的研究大部分工作都是致力于从未标记的数据中识别负样本,因此主要是应用监督学习方法来构建分类器。但对剩余的未标记数据,要么将它们排除在学习阶段,要么强行将它们归属于某一类,这极大限制了PU学习算法的性能。此外,先前的PU方法一般都假设训练实例和测试实例具有同样的属性表示。但是总可以收集那些训练数据有但测试数据不具有的特征,这些特征被称为特权信息(privileged information,PI)。本文提出了一种基于相似权重的方法来解决具有特权信息的PU学习问题(A new method based on similarity approach for the problem of positive and unlabeled learning with privileged information,SPUPIL),该方法主要分为两个步骤:首先,从未标记样本中提取可靠的负样本并采用K近邻分类(K-nearest neighbor classification,KNN)方法生成相似权重,然后,将相似权重和特权信息融合到基于排序支持向量机(Ranking support vector machine,Ranking SVM)的学习模型中,应用拉格朗日方法把原始问题转变为对偶问题,并对其求解之后得到一个更精确的分类器。真实数据集上的大量实验结果表明,SPUPIL算法的分类效果比现有的PU学习方法的分类效果更好。综上所述,本文在具有特权信息的PU学习问题上所做的主要贡献可以总结如下:1.针对具有特权信息的正标记和未标记学习问题,提出了一种新的基于Ranking SVM的SPUPIL模型。首先从未标记的例子中提取可靠的负例,然后用KNN方法计算一个样本对(Example Pair)对正类和负类的相似权重。此外,还通过将训练数据、相似权重和特权信息融合到学习阶段来扩展标准排序支持向量机。据我们所知,这是第一次研究带有特权信息的正标记和未标记学习的排序支持向量机模型,即首次将特权信息引入正实例和未标记实例学习中。此外,排序支持向量机不仅提供了SPUPIL方法的性能,还提供了实例在训练数据中的排序。2.为了求解本文提出的SPUPIL算法的目标方程,利用拉格朗日方法将初始问题转变为对偶问题,然后利用最优的拉格朗日因子来求解该问题。最后,能够得到带有特权信息的正标记和未标记学习的Ranking SVM分类器。因此,我们可以解决具有特权信息(仅训练期间可获得的信息)的PU学习问题。3.本文进行了一些实验来测试SPUPIL方法的性能。真实数据集上的大量实验结果证明SPUPIL算法比现有的PU学习算法具备更优的、更稳定的性能。
其他文献
近些年我国经济发展突飞猛进,人们生活质量得到了显著的提高,我国老年人口基数的日益增长使得解决养老问题迫在眉睫。我国在解决养老问题上已经搭建了许多体系和机构,为老年人提供的设施设备也越来越齐全,这促进了我国养老事业的发展。园艺疗法是一种以植物为基础,使参与者围绕植物进行相关的园艺体验来达到人体身心健康、改善人体机能的自然方式。把园艺疗法应用在养老居住环境当中能够使老年人的生活变得丰富多彩,还能改善情
大型风力机运行在复杂的工况下,考虑到各种复杂环境非定常载荷对于风力机叶片和整机的结构影响以及结构反作用下的气弹耦合效应,结构颤振变形的影响,准确的分析计算具有较大难度,研究建立一种可靠有效的风力机仿真分析模型具有重要意义和价值。本文以兆瓦级风力机为研究对象,在Recur Dyn软件搭建风力机刚柔耦合多体模型,采用球铰优化后的超级单元法建立大型风力机叶片、塔架以及整机模型,通过对风力机模型进行预分析
为了实现万物互联,射频识别(Radio Frequency Identification,RFID)已经成为物联网领域的关键技术之一,在服饰零售、物流溯源和环境监测等领域有着广泛应用。随着RFID标签成本的不断降低和应用场景多样化,RFID传感标签被赋予了重要的学术意义和工程价值。传统RFID传感标签往往只能监测单一环境参数,无法满足实际环境监测需求。随着标签芯片功耗的降低和标签天线设计水平的不断
通过声学探测获知海底沉积物的物理性质,对沉积物的类型做出识别、反演,在海底声学遥测、海洋工程、海底资源探测、国防军事等领域至关重要。对海底沉积声学的研究,原位声学探测是最主要的研究手段之一,国内海底原位声学探测系统研究发展较快,目前测量水深、探测频率范围等各方面性能基本达到国外研究水平,但尚缺乏海底原位剪切波探测功能。基于此,论文提出研究具备压缩波和剪切波探测双功能的压载式海底沉积物声学原位测量系
微尺度下的金属箔板微成形技术主要是通过精密模具、激光对零件进行加工,其中,精密模具微成形工艺存在刚性冲头的损耗、驱动设备复杂、凸凹模对中困难等问题,激光加工工艺存在激光热烧蚀、吸收层的无法补偿导致无法多次加工等问题。针对上述微成形工艺存在的问题,本文提出利用激光诱导空化产生的等离子体冲击波、溃灭冲击波与高速射流形成的空化载荷,对工件进行非机械接触式加工。激光诱导空化微成形技术能够实现精确定位加载,
三电平T型拓扑结构,对比二极管箝位拓扑(I型拓扑)因每相少了2个开关二极管,具有功率器件少、开关损耗均匀等优势,使其在高压大功率场合得到了广泛的应用。目前,在三相三线制和三相四线制接法的配电网系统中,并网逆变器采用了不同的调制方法。同时,为了抑制功率波动,传统两级式三电平并网逆变器直流母线一般采用容值较大的电解电容。但是电解电容存在使用时间短和耐压低等缺点,难以满足并网逆变器稳定性要求高和使用时间
液晶光栅是一种液晶在经过表面处理后的液晶盒中受到外加场影响而产生的一种周期性光栅结构,这些光栅的周期可以达到微米数量级。此外由于液晶的介电各向差异性和光学上的各向差异,使得这种液晶式光栅可以经过改变外加场的参数来改变液晶分子的取向从而来控制液晶光栅的周期和相位角。相比较于传统光栅,液晶光栅拥有可以改变周期、相位角以及液晶光栅体积小、工艺简单、造价便宜等优点让其逐渐取代传统光栅成为光学器件中的热门。
煤矿事故,以及儿童坠入深井事故的频发,使得深井搜救这个话题进入了公众的视野。而当遇到深井口径小或是井底空气稀薄等问题时,救援人员下井救人这种传统方式显然不是救援的最优方式。因此,如何做到既不需要救援人员冒险作业,又可以保证将被困者成功救出,是一个值得讨论的话题。针对上述问题,本课题设计了一个悬挂式机械臂系统代替人来完成深井搜救的任务。通过对悬挂式机械臂的工作空间计算分析,验证本课题设计的机械臂为执
目前绝大多数脑机接口主要是用于科研领域的多通道或侵入式脑机接口,其通过获取大脑皮层或内部神经元脑电信息达到人机交互、外设控制的目的,但由于多通道脑机接口价格高昂以及繁杂的配戴流程,很难走出实验室在实际生活中得到应用;而侵入式脑机接口还需要进行昂贵高风险的脑机接口植入手术,对于多数肢体残疾人的家庭而言,更是一个沉重的负担。相对而言,单通道脑机接口虽然在脑电信息传输量和控制精度方面不如多通道脑机接口和