论文部分内容阅读
随着科学技术的快速发展,社会各界每天都有大量数据和信息产生。这些数据和信息的确给我们带来了方便快捷的生活,有时也带来了不小的麻烦,人们常常难以轻松获取想要的有价值的信息。与此同时,随着数据规模和种类的不断扩大,越来越多的数据朝着高维小样本方向发展,特征空间中存在着大量的冗余、无用的特征,这些特征加大了人们学习和认知事物本质的难度。特征选择则正是在这样的背景下产生的,通过从原始特征空间中筛选出有效的特征子集,排除大量无用特征,从而降低处理问题的难度,因此特征选择在实际生活中得到了广泛的应用。在特征选择方法的发展过程中,涌现了许多有效的优化算法,而布谷鸟搜索算法就是其中的一种新兴的方法。布谷鸟搜索算法是一种来源于对布谷鸟寻窝产蛋行为进行模拟而得出的搜索方法,它具有参数少、收敛速度快等特点。本文在原始布谷鸟算法以及二进制布谷鸟算法的基础上,引入了量子搜索算法的思想,提出了一种新的基于布谷鸟搜索的特征选择算法。本文的主要研究内容如下:(1)介绍了特征选择问题的研究背景、研究现状,描述了特征选择的基本框架,并按不同分类标准简单介绍了几种特征选择算法。(2)对布谷鸟算法的来源进行了叙述,详细说明了布谷鸟算法以及二进制布谷鸟算法的原理和流程。(3)为了提高布谷鸟算法的效率,引入量子搜索算法的概念,对量子搜索的过程进行了简单推导,提出了基于量子运算的二进制布谷鸟算法,改进了原始的布谷鸟算法,让算法不再以随机方向进行搜索,而是在莱维飞行随机步长的基础上朝着最优解方向进行,加快算法的收敛速度,减少算法的迭代次数,提高了算法的效率。(4)利用改进的新算法处理背包问题以及微阵列数据的特征选择问题,使用支持向量机做分类来衡量和评价所选出的特征子集,介绍了微阵列技术的概念和微阵列数据的特点,对支持向量机的基本原理等做了简单描述。通过测试与其他方法的结果进行了比较,证明了改进的算法具有良好的性能。(5)最后对全文进行总结,并提出了几点对于未来进一步研究的想法。