缺失标签环境下的多标签特征选择方法

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:hejianfeng05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中,数据存在于方方面面,且这些数据可同时被打上多个标签,此种数据被称为多标签数据。随着信息科学的发展,多标签数据的特征规模呈现爆炸式增长,使得传统多标签学习面临严峻挑战。特征选择能有效解决高维度数据造成的各种问题,凭借这一特点,近年来已成为一种常用的数据预处理方法。以往的多标签特征选择算法在构建算法模型时,都假设数据的标签空间是完整且可预先获取的。然而,在监督学习的实际任务中,数据的标签空间存在缺失标签,并且存在标签以数据流的方式动态流入标签空间的情况。因此,在缺失标签和流缺失标签场景下构建多标签特征选择算法模型,具有广泛的应用价值和现实意义。本文针对缺失标签和流缺失标签场景下的多标签特征选择算法展开研究,主要研究工作如下:(1)针对缺失标签场景,将缺失标签补全是一种有效的处理方式。为了达到标签补全的目的,为每个类别标签从原始特征空间挑选固有类属属性,并通过构建类属属性与标签间的相关性,补全缺失标签。基于这种思想,提出了一种缺失标签下基于类属属性的多标签特征选择算法(Multi-label feature selection based on label-specific feature with missing labels,MFSLML)。首先,依照稀疏学习策略可得到每个类标签的固有类属属性;其次,每个类标签与其固有类属属性的对应关系将利用线性回归模型进行构建,并恢复缺失标签;然后,依据类属属性选择特征;最后,通过对比实验证实了所提算法是有效的。(2)目前很多领域存在标签随着时间的推移动态到达的场景,现有的缺失标签下的多标签特征选择算法并未考虑这一问题。对此,针对(1)中的工作,进一步考虑动态流标签场景,提出一种流缺失标签下的多标签特征选择算法(Multi-label feature selection with streaming and missing labels,MFSSML)。首先,学习已到达标签间的相关性;其次,利用标签相关性补全缺失标签;然后,通过类属属性计算特征得分选取特征子集;最后,通过实验表明与对比算法相比所提算法分类性能较优。
其他文献
《义务教育美术课程标准(2011年版)》中强调美术与人类社会生活有着复杂密切的联系,是人类生活的重要组成部分。美育不仅可以拓宽学生的文化视野,还能增进对自己国家文化的认同感及其它各国优秀文化的了解,认同文化的多样性。从这个角度出发,结合近些年来我国对于传统民间美术的重视性,基于大概念等理论的指导,本课题计划在初中美术教学中进行京剧脸谱艺术单元化课程的开发与实践研究,以此来增进学生对于京剧脸谱艺术板
学位
写作评价有助于及时地诊断写作问题和有效地提高英语学习者的写作能力。然而,在高中英语写作教学中以单一的教师评价为主,这种评价方式既使得教师耗时费力,又因其缺少活力,在一定程度上挫伤了学生在写作方面的积极性、自信心。基于此,如何对学生的作文进行高效的反馈是学者和一线教师一直关注的问题。为了解决这一问题,文秋芳和她的团队在2016年提出了师生合作评价的新型评价形式。它整合了教师评价和同伴互评的优势,由专
学位
近年来,随着现代信息科学与物联网技术的飞速发展,海量数据处理成为了研究学者普遍关注的热点问题。快速傅里叶变换(Fast Fourier Transform,FFT)是最重要的信号处理技术之一,FFT的执行时间决定了硬件系统的实时能力。于是,关于海量点数FFT算法的加速设计及其硬件实现,逐渐成为了视频监控、自动驾驶、声呐信号分析、雷达信号处理等一些追求高实时性能的科技领域的研究热点。现如今,摩尔定律
学位
随着国家城市化进程的加快,社区作为城市最基础的单元,社区的建设直接影响到城市的面貌和居民的精神状态。社区是居民日常生活的主要场所,是居民了解文化和国家政策的宣传平台之一,社区品牌的建设承载着社区的发展历程和人文历史,是年轻人了解社区文化和历史的载体,也是对外向公众展示的窗口。由于城市建设的飞速发展,社区品牌同质化现象严重,塑造个性化的社区品牌显得尤为重要。特色的社区品牌对内有助于提高社区居民的归属
学位
随着“一带一路”的不断推进与发展,越来越多的国家参与到“一带一路”的建设中来,国际投资与贸易日趋增多,伴随着的国际商事纠纷也日趋增多。为更好的服务“一带一路”的建设,弥补国际商事调解与仲裁的不足,2018年最高人民法院在深圳市设立第一国际商事法庭、在西安市设立第二国际商事法庭,随后,又在地方设立苏州国际商事法庭和北京国际商事法庭,从而为打造“一站式”国际商事纠纷多元化解决机制、更好地解决国际商事纠
学位
在前人研究成果的基础上,根据现场剖面观测、测井资料解释,运用沉积学的理论方法、测井方法和原理,对定边油田长6油层地层的沉积特征进行了详细研究。定边油田位于鄂尔多斯盆地中西部,长6油藏群是其主要油藏之一。通过标记层法、地层厚度法,结合邻井对比分析和旋回对比,在前人研究成果的基础上,通过定边油田长6油层组的地层划分和对比,将长6油层组划分为三个小层:长61、长62和长63。而且这三个子层厚度稳定,平均
学位
教学模式是指在教学理论的指导下,基于课堂实践形成的标准化、相对稳定的教学组织和设计方案。对外汉语教学模式作为连接教学理论和教学实践的桥梁,起着指导汉语教学的作用,是汉语教学界研究的热点之一,其研究成果十分丰富,呈现出多元化的研究视角。对外汉语教学模式的研究根据内容可分为应用研究、建构研究和反思研究,本文基于此归纳了对外汉语教学模式的研究现状,进一步分析了教学模式研究的发展趋势,探究研究特点及以及存
学位
斐济是太平洋地区经济强国之一,以贸易、发展和教育为中心。作为一个发展中国家,斐济对农业部门的依赖性远远强于工业部门。虽然旅游业是主要产业,但斐济更多依靠农业生产水果和蔬菜。在这些农产品中,卡瓦在国际市场上有高质量的市场定位。本研究旨在研究卡瓦国际贸易对国内经济贡献。采用矢量误差修正模型(VECM)评估国际贸易影响因素。该研究利用相对出口绩效(RCA)和贸易竞争力(TC)探索斐济在国际卡瓦市场中的潜
学位
自古以来,植物在人类社会生活中占据着重要的地位。作为最鲜艳的植物之一,花卉在日常生活和交际中十分常见,它给人们带来愉悦的感官享受的同时,还能间接地传递人类的情感与思想。因此,人类创造了相应的花卉词以方便交流和使用。作为一种词汇,它既有字面意义,也存在丰富的联想意义。由于花卉实体的形态在不同的国家里相对保持不变,生活在不同地区的人对同一种花卉有着相同的基本认识,故英汉花卉词的字面意义是一致的。根据利
学位
高中化学课程中明确介绍了丁达尔效应,很多学生都对丁达尔效应有所了解。同时,在我们日常生活过程中,也随处可以见到丁达尔效应。比如在森林中透过树叶缝隙射出的一丝丝光线,在电影院中投影仪投射电影的原理。这些生活中随处可以见到的场景都是丁达尔效应。但我们在学习过程中,很多不严谨的研究错误的将牛奶和豆浆定义为胶体,使得学生在学习丁达尔效应中对胶体的概念确定不清楚,所以本文章对牛奶和豆浆丁达尔效应的实验进行探
会议