高维数据集上的降维算法及其应用

被引量 : 0次 | 上传用户:popoxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术迅猛发展使我们获取数据日益容易、关注的数据对象也日益复杂。学术和实业界对数据处理和分析技术的需求也更加迫切,尤其是对高维和大数据分析处理,是统计和计算机科学与技术研究领域和实业界关注的热点课题,高维数据降维分析处理即是有着重要理论意义和应用价值的问题之一。本文主要研究运用随机方法和计算技术为基础探讨高维数据的降维方法。传统的数据分析处理技术在应对现时的高维数据时往往难以奏效,典型的例子是维数灾等。当前有效的高维数据降维技术大多广泛使用了随机方法和高维数据集上的统计学习方法。本文在经典的统计机器学习方法和高维数据集上的统计学习算法的基础上,对随机投影方法、PCA方法、AdaBoost方法和微分演化算法在高维数据降维方面的技术进行研讨,给出了两个新的高维数据降维算法及对一个现有的典型的高维数据降维算法进行了改进。主要结果是:一、给出一个结合随机投影和PCA的新的高维数据降维算法;二、给出一个结合AdaBoost和微分演化的新的降维算法;三、改进了现有常用的高维数据降维的确定性稳健PCA方法。我们运用了概率统计方法和算法分析设计思想,对所给出的新算法进行了理论分析,并使用所给出的算法在图像分析处理数据问题进行了实验。实验结果也表明文中所给出的方法的优良性。
其他文献
以酞菁绿膏状物为原料,用不同类型的表面活性剂对其实施表面处理,研究了表面活性剂种类及添加量对酞菁绿分散性的影响。结果表明,添加某些非离子表面活性剂及两种不同类型物质组
利用金属离子负载的阴离子模板介孔二氧化硅(M-AMS-2)材料,作为脱除天然气中有机硫化物甲硫醚的吸附剂。实验考察了制备吸附剂的反应时间、改性溶液浓度及体积,不同金属离子
麦角甾醇,又被称作麦角固醇,它大量的存在于食药用菌当中,它是一种极其重要的医药化工原料,它也是生产激素类药物的中间体,可以用来生产“黄体酮”、“可的松”等药物。当麦
敦煌曲子戏以自娱自乐的形式,自唐、宋、元、明、清至现在,经过了近千年,始终在民间流传、发展、充实,形成了自己独特的风格,是敦煌曲子词在民间的待续,是敦煌艺术不可分割的
伴随着计算机技术的不断发展,制造行业的基石—数控技术也逐渐突破了原有的局限性,在保留高实时性、高精度以及高速度的前提下正朝着网络化、智能化、开放式方向发展。影响数控
校报新闻图片与文字说明的有机结合能产生增值效应、强化效应、美化效应。为了实现这些效应 ,新闻图片与文字说明的组合不能简单地拼凑 ,而要注意其组合形式。这些形式主要表
我国十分重视草原旅游项目的开发,许多省市自治区都开发了草原旅游。但从理论上,国内外学者对草原生态系统的旅游研究还比较少,因此,对草原旅游发展的研究显得迫在眉睫。在草
目的了解山区空巢老年2型糖尿病患者健康状况及影响因素,为社区干预提供依据。方法抽取浙江省丽水市15个街道/乡镇共30个行政村空巢老年糖尿病患者78例(空巢组),根据年龄和性
肌萎缩侧索硬化症是一种致死性神经变性疾病,尚无有效治疗措施,干细胞因具有分化成运动神经元的潜能而受到极大关注。用于肌萎缩侧索硬化治疗的干细胞包括胚胎干细胞、神经干
快速提高农村小学生书写能力,激发小学生学习书写兴趣,实施一套切实可行、适合小学生学习特点的书法教学法是进行本次教学实践研究的初衷。本文以甘肃白银平川邵家水小学为教