一种基于集成学习的多示例分类模型

来源 :中山大学 | 被引量 : 0次 | 上传用户:wkellyai_0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例分类模型最早是Dietterich等人[1]在研究如何解决制药业中选择哪种分子入药中提出的一种模型。在多示例学习中,我们直接把标签赋给多个示例组成的包,而不是包中的示例。如果包中至少有一个正示例,那么我们就把这个包标记为正包,反之,则将这个包标记为负包。到目前为止,已经有许多学者对多示例算法学习进行大量的研究,但是如何构造高效的多示例学习算法仍然是目前研究的热点。本论文将从分类精度这方面对多示例分类模型进行研究。   本文通过对多示例学习算法进行研究,发现只要在单实例学习目标函数中引入多示例问题的约束,那么传统监督学习方法也能够在多示例问题中取得比较好的分类能力。此外,考虑到集成学习方法能使传统监督学习算法提高泛化能力,本文在多示例学习模型中引入集成学习思想。实验结果表明这种方法可以解决多示例问题,也可以提高多示例学习算法的泛化能力。   关于多示例学习,虽然支持向量机已经取得较好的分类能力。但是,用全局数据训练得到的SVM分类模型未必适合个别未知类别样本。考虑到支持向量机在分类时,对分类结果产生影响主要是决策面附近的数据,而那些离决策面较远的数据对分类性能影响不大。本文提出一种基于SVM-KNN局部样本支持向量机的分类方法。   在Musk和Corel数据集实验中所得结果表明,集成学习的确能显著提高多示例学习算法的泛化能力。SVM-KNN局部样本支持向量机方法也提高了MI-SVM和mi-SVM分类精度。
其他文献
Web服务发展已相对比较成熟,如何有效地自动组合互联网的Web服务以完成复杂的功能则成为人们新的研究热点。语义网被称作“下一代Web技术”,语义Web服务则是融合了语义Web技术
人脸图像反映了重要的年龄信息,人脸年龄估计有着重要的研究意义和应用价值。对人脸年龄估计进行深入探索,将会对模式识别、人工智能、机器人等领域的研究起到巨大推动作用。
由于以关键帧形式手动编辑计算机角色运动要求对真实人体运动特征有深入的理解,并且编辑过程过于繁琐,而基于物理力学的计算机角色运动合成方法生成的运动数据真实性较低,再
残基对的相互作用描述了蛋白质三维结构中一对残基的空间距离关系,相互作用的残基对对维护蛋白质结构的稳定起着重要作用。蛋白质中所有残基对的相互作用关系确定了蛋白质三
随着计算机技术的不断发展,许多企业都构建了大量的应用系统。然而由于多方面的原因,这些不同应用系统彼此独立,互不相通,形成了一个个“信息孤岛”,数据不能共享,业务无法协同。企
随着计算机技术、通信技术和多媒体技术的飞速发展,高质量的视频传输已逐渐成为数字通信网络的主要业务,将嵌入式技术与网络、通信和多媒体技术的相互融合将成为数字视频通信
计算机安全自互联网普及以来逐渐成为人们关注的焦点,安全问题也成为业界最为头疼的问题。使用木马、病毒和蠕虫在互联网上窃取用户的个人敏感信息的事件也屡见不鲜,而这些恶
随着信息化技术的发展和数字化产品的普及,以计算机技术、芯片技术和软件技术为核心的嵌入式系统成为当前研究和应用的热点。微电子技术和嵌入式操作系统的不断发展,为数字网
随着科技的进步和技术的发展,在临床医学中医学CT图像发挥着越来越重要的作用,它成为医师诊断疾病的重要手段,尤其在肺癌的早期检查中。近年来,医学影像技术的发展提高了医学
自R.Ahlswede等人于2000年提出网络编码的理论以来,网络编码逐渐成为网络信息论的研究热点。目前网络编码的研究开始逐渐向应用领域发展,如无线网络编码、传感器网络、大文件分