【摘 要】
:
随着计算机存储技术的发展,日常生活中产生了海量数据。对大规模数据进行分析,从中挖掘出隐藏的有价值的信息逐渐成为当今时代的热点。聚类技术和降维技术是两种常用的数据分析方法。聚类用以寻找数据内在的分布结构,降维用以缓解维度灾难。但是传统数据分析方法在分析海量高维数据时存在操作过程繁琐,分析准确率低等缺点,因此研究用于同时实现聚类和降维的高精度模型势在必行。本文首先提出了基于曲线距离分析的嵌入式聚类算法
论文部分内容阅读
随着计算机存储技术的发展,日常生活中产生了海量数据。对大规模数据进行分析,从中挖掘出隐藏的有价值的信息逐渐成为当今时代的热点。聚类技术和降维技术是两种常用的数据分析方法。聚类用以寻找数据内在的分布结构,降维用以缓解维度灾难。但是传统数据分析方法在分析海量高维数据时存在操作过程繁琐,分析准确率低等缺点,因此研究用于同时实现聚类和降维的高精度模型势在必行。本文首先提出了基于曲线距离分析的嵌入式聚类算法以同时实现高精度聚类和降维。该算法首先计算高维空间中样本之间的成对曲线距离。然后构造权重函数限制目标函数以保持样本映射至低维空间的局部拓扑结构不变性。最后由聚类的内部标准引导样本将其映射至低维空间,从而得到聚类和降维结果。本文还提出了一种由成对约束引导的基于曲线距离分析的嵌入式聚类算法。该算法首先选取4种聚类效果优异的基聚类算法,使用聚类集成方法得到部分样本的高置信度样本伪标签。成对约束可由以下两种方式获得:模型将属于同一簇的任意两样本作为最相似的样本对,将属于不同簇的任意两样本作为最不相似的样本对。然后模型计算高维空间中样本之间的成对曲线距离。接下来模型利用成对约束和聚类将高维空间样本的局部拓扑结构映射至低维空间,从而获得聚类和降维结果。本文提出的两个算法都在公开数据集上进行了广泛的实验。实验结果表明本文所提出算法有效地简化了数据分析过程,以高准确率同时实现降维和聚类。此外,本文所提出的算法可作为通用的高精度降维和聚类框架。
其他文献
本文主要研究了不同Si含量掺杂的Si Zn Sn O(SZTO)薄膜的制备与性能的研究、以及不同氩氧比条件下溅射所得SZTO薄膜的制备与其相关的性质的研究。氧化物半导体是一种具有半导体特质的氧化物。透明导电氧化物被广泛用作透明电极在光伏器件、平板和触屏显示器上。最受大家关注的是“透明非晶氧化物半导体(TAOS:Transparent Amorphous Oxide Semiconductors)”
党的十九大报告指出,创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。研发投入作为国家创新的着力点,在提高地区全要素生产率和建设现代化经济体系过程中发挥着重要作用。经研究发现,我国东中西部三大地区研发投入的内部结构存在一定差异,对各地区的绿色全要素生产率发展带来了不同影响。本文从研发投入的内部结构入手,分别探究我国三大地区在研发投入强度、研发投入规模和研发投入的不同领域等三个方面存在的异质
项目型制造简称ETO(Engineer To Order),即面向订单设计,是生产大型复杂产品的采用项目管理方法的制造类型。供应商的表现对项目型制造企业的绩效影响很大,供应商的质量、价格、交货期和服务是最关心的指标,而其中质量又是重中之重。对项目型制造企业的特点、发展现状和问题进行了归纳,并总结了项目型制造企业供应商管理和供应商选择的相关理论。通过对项目型制造企业与非项目制造企业对比,分析了供应商
我国正处于城镇化加速阶段,导致城市风环境逐渐恶化,寒地城市因其独特的风环境特征,冬季雾霾频发的同时还伴随着热舒适度差的现象,与非寒地城市风环境问题截然不同。目前关于城市气候的研究已初具成效,但研究成果难以与现有城市规划或城市设计进行衔接,导致关于城市气候研究的成果无法落实。改善城市风环境首先从需要城市整体角度出发,通过城市整体层面结构优化和空间形态控制,进而达到改善城市气候环境的目的。2017年3
当前,STEM教育在中国进入蓬勃发展阶段,时代发展与社会经济的推动使得STEM教育面临着前所未有的机遇与挑战。凝心聚力,砥砺前行,我国正尝试探索出一条中国特色的STEM教育道路,STEM教育被纳入国家战略发展政策,各地相继推行STEM课程试点学校申报,STEM教育研究在理论与实践方面取得一定进展。但与此同时,当前教育体系下的课程模式制约着STEM教育的推行,STEM课程开展的有效性与课程设计的规范
协同过滤推荐算法是一种当下应用广泛的推荐技术,是智能电子商务的重要组成部分。虽然传统的协同过滤算法已经实现了智能推荐,但是其推荐精度任然不高,推荐结果的个性化程度
我国《民法总则》第十条的规定,首次从立法层面确立了习惯的法源地位,交易习惯作为习惯的一种,具有解释、补充合同和鼓励交易等意义。根据我国《最高人民法院关于适用<中华人民共和国合同法>若干问题的解释(二)》规定,交易习惯是某地区、某行业或当事人之间的习惯做法,并且主观上要求“知道或应当知道”,结合自身的时间性、领域性、主体特定性等特点,交易习惯为大众或特定人所熟知、应知的,且被重复使用的社
传统的紧耦合网络为人带来便利的同时,其诸多弊病也为越来越多的人所诟病。因此,近年来许多人都开始研究和探索新的网络体系结构,软件定义网络(Software Defined Networking,
创新是一个国家经济健康发展的关键,核心技术的自力更生更是关系到国家安全与经济命脉,而企业创新是国家创新的经济基础。作为创新型企业不断创新的重要驱动力,风险投资为企
农业是我国经济发展的基础,而农业现代化是整个国民经济现代化的基础。由传统的依赖投入大量要素的粗放型农业经济增长方式转变为通过农业全要素生产率增长为推动力的创新驱动型增长方式,是实现未来中国农业经济可持续发展的关键所在。乡村振兴战略提到“发展乡村普惠金融,优化金融资源配置”,强调了农村普惠金融发展在农业现代化进程中的重要作用,为新农村建设指明了方向。本文以金融发展理论为基础,普惠金融相关理论、金融对