【摘 要】
:
近年来,多标签学习在文本分类、图像识别以及生物信息学等多个领域受到广泛关注。目前多标签学习关注的主要问题包括标签关联性以及标签复杂度,而分类器链方法是一种兼顾标签
论文部分内容阅读
近年来,多标签学习在文本分类、图像识别以及生物信息学等多个领域受到广泛关注。目前多标签学习关注的主要问题包括标签关联性以及标签复杂度,而分类器链方法是一种兼顾标签关联性与复杂度的方法。这种链式方法所考虑的标签关联性是一种高阶的关联性,并且它在拥有线性复杂度的同时还具有良好的灵活性。但是其容易产生链序问题,从而导致预测结果不稳定的问题。梯度提升是一种传统单标签机器学习集成方法,其可以自动关注错分样本,提高分类精度。基于此,本文采用了梯度提升的思想来对分类器链方法进行了改进,着重解决了链序问题,提升分类精度的同时保持分类器链算法的简单灵活性。同时,结合标签降维算法提出一种基于局部标签关联的改进GBCC算法。本文的主要研究工作如下:1.为了解决分类器链算法预测性能不足以及链序问题,本文提出了一种适用于多标签的梯度提升方法。首先,该模型将梯度提升方法引入传统的多标签分类器链方法中形成一种新的层次结构。其通过前后层次之间的特征传递以及标签传递,建立起高阶标签关联性的同时解决链序问题,提升分类精度与算法稳定性。其次,在层次间传递信息的过程中,通过计算标签置信度与误差评价分数构建起一种预剪枝策略,以起到模型剪枝与防止模型过度拟合的作用。2.为了进一步提升算法的效率,结合一种标签空间的平衡聚类法以及基于局部标签信息增益率的特征选择方法,提出一种基于局部标签关联的改进分类器链算法。首先,针对标签集合进行标签空间的平衡聚类,将一个整体的大任务划分成多个小任务,加速训练,并提高了算法的可并行特性。然后,在局部标签集合上对特征空间进行基于局部标签信息增益率的特征选择,提高集成算法的异构性,进一步加速模型训练。
其他文献
图像分解是图像处理领域中的一个重要研究热点.图像一般可以分解为卡通和纹理两个部分,从卡通部分的显著性边缘信息中获取图像模糊因子,从纹理部分中获取图像的噪声强度因子,
数字多媒体广播(Digital Multimedia Broadcasting,DMB)具有覆盖范围广、效率高的优势,可以同时向大批量终端发布信息等特点,能够与通信网络形成有效互补。但是由于DMB的带宽
目的:研究鉴定分枝杆菌细胞壁脂质PDIM诱导Gal-3表达的TLR信号通路,明确Gal-3对PDIM调控炎症介质释放的影响及其机制;并进一步研究Gal-3对PDIM介导肉芽肿形成的意义与机制。方法:将Raw264.7细胞分为正常对照组(Mock)、WT野生株和PDIM缺失突变株(命名为△PDIM)感染组。(1)Western blot检测各感染组0.5-4 h内Gal-3蛋白表达,qRT-PCR检
随着人工智能技术的飞速发展,汽车产业的技术革命迫在眉睫。近年来,无人驾驶汽车,作为两者的结合,逐渐受到越来越多学者以及产业界的关注。导航算法作为自动驾驶的核心组成,
相比传统人脸检测方法,运用深度学习理念的人脸检测算法在检测精确度上有很大优势,它拥有深层次的主干网络,能够提取到图像中更抽象的特征值,模型结构更加复杂,候选框等参数
在磁惯性聚变的套筒压缩磁化等离子体内爆过程中,真空和套筒界面、套筒和燃料界面由于MRT不稳定性导致扰动剧烈发展,影响聚变等离子体品质。MRT发展程度及其调控是影响磁惯性
随着智能制造时代的到来,机器人技术的发展受到了人们的广泛关注。智能移动机器人可应用于工业和服务业,节约大量的经济与人力成本以及丰富人们的生活。在智能移动机器人执行
随着大数据时代的到来,政府数据开放运动在全球范围内开展起来,各国政府将开放政府数据上升到国家战略的高度,这说明各国政府已经认识到开放政府数据的重要性。我国政府也不例外,近年来,政府部门积极开展政府数据开放工作,挖掘政府数据的潜在价值,充分意识到政府数据开放的重要意义。本文通过文献调查法对国内外政府数据开放相关研究进行整理分析发现,目前国内学者对于政府数据开放与公众服务等方面研究较少,而开放政府数据
为了更好地胜任不同行业的口译工作,口译员不仅需要掌握必要的语言知识,还应当广泛涉猎,增加言外知识储备。国内外学者的研究表明,言外知识对口译的各个环节都有着重要的影响,与口译成效正相关。本文首先从前人的相关研究切入,对言外知识进行界定并概括其对口译的普遍影响;之后以笔者参与的第二届“一带一路”国际合作高峰论坛普京记者会俄汉交传模拟会议为探讨案例,分析口译过程中言外知识带来的积极影响及言外知识不足引起
实验作为加深学生对理论知识的理解,培养学生动手实践能力的重要手段,近年来正在得到各大高校的重视。远程虚拟实验是一种高效灵活的实验方式,不仅解决了传统实验模式存在的