基于对称非负矩阵分解的鲁棒聚类算法研究

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:wljb1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对称非负矩阵分解SNMF(Symmetric Nonnegative Matrix Factorization)作为一种基于图的聚类算法,能够更自然地捕获图表示中嵌入的聚类结构,并且在线性和非线性数据上获得更好的聚类结果,但对变量的初始化比较敏感。另外,标准的SNMF算法利用误差平方和衡量分解的质量,对噪声和异常值敏感。为了解决这些问题,在集成学习视角下,提出一种鲁棒自适应对称非负矩阵分解聚类算法RS~3NMF(Robust Self-adaptived Symmetric Nonnegative Matrix Factorization)。进一步,结合训练集的标签信息增强投影矩阵的判别能力,将鲁棒性、自适应学习和标签信息集成到SNMF框架中,提出一种鲁棒自适应学习判别对称非负矩阵分解算法(Robust Adaptive Learning Discriminative Symmetric Nonnegative Matrix Factorization Algorithm,RADS~3NMF)。本文主要研究内容包括以下两部分:(1)受鲁棒非负矩阵分解、自适应方法和集成学习的启发,建立鲁棒自适应对称非负矩阵分解聚类算法(RS~3NMF),该算法将鲁棒性融入SNMF框架。基于L2;1范数的RS~3NMF模型缓解了噪声和异常值的影响,保持了特征旋转不变性,提高了模型的鲁棒性。同时,在不借助任何附加信息的前提下,利用SNMF对初始化特征的敏感性逐步增强聚类性能。采用交替迭代方法优化,并保证目标函数值的收敛性。大量实验结果显示,所提RS~3NMF算法优于其它先进的算法,具有较强的鲁棒性。此外,对我国31个省市GDP数据进行实例应用,结果表明该鲁棒聚类算法对GDP数据的划分能够判断各省之间的发展差异,具有良好的实际应用价值。(2)受空间聚类自表述学习方法的启发,通过引入范数、自适应学习和标签信息,建立鲁棒自适应学习判别对称非负矩阵分解算法(RADS~3NMF)。具体地,首先由获得的自表示系数表示亲和矩阵,并利用训练集的标签信息增强投影矩阵的判别能力;其次对建立的模型进行优化求解,构造辅助函数,证明模型的收敛性,以及给出模型的算法复杂度;最后利用某一时间段北京市二氧化氮(NO2)污染物小时浓度数据,将该算法应用于北京市空气质量监测站点布设聚类分析,结果显示RADS~3NMF算法能够较好地识别空气质量监测站点的空间布局,具有良好的适用性。
其他文献
习近平总书记从提出绿水青山就是金山银山在到要在2060年实现“双碳”目标,彰显大国担当。作为世界上能源最大的能源消费和生产国,我国碳市场已经取得了跨越式进展,2010年到2021年,从首次提出建设碳市场到全国碳市场开市交易,意味着我国低碳发展已经取得阶段性胜利,为实现新能源转型取得了更为广阔的市场,基于此,深入挖掘研究碳排放权交易价格(以下简称碳交易价格)的影响因素以及内在机理对预测碳交易价格帮助
学位
Cox比例风险模型在生存分析中扮演着重要的角色,它能够利用风险函数研究变量与生存函数间的关系,初步处理存在删失情况的生存数据,但实际生活中的数据通常不满足Cox比例风险假定。针对这类数据,引入部分线性可加Cox模型,实现对时依协变量的变量选择研究。本文主要研究内容分为以下三部分:(1)通过B-样条曲线拟合部分线性可加Cox模型中的非参数部分,将模型中未知分量函数选择问题转变为处理线性组合中选择系数
学位
近年来,贸易保护主义抬头,逆全球化势头高涨,新冠疫情的冲击挥之不去,全球经济不稳定不确定性明显增强。从国内环境看,中国正处于经济增速换挡期、结构调整阵痛期、前期刺激政策消化期三期叠加的阶段,改革发展稳定任务艰巨。面对当前中国经济发展的新环境和新阶段,双循环新发展格局应运而生。2020年5月14日,中央提出“深化供给侧结构性改革,充分发挥我国超大规模市场优势和内需潜力,构建国内国际双循环相互促进的新
学位
学位
在日常生活中,人们会接触到各式各样的、来源非常多元化的数据.为了发掘与利用数据的潜在价值,需要根据数据的特点构建各式各样的统计模型.随着大数据时代的到来,数据量的增加使得诸如分层数据这样具有复杂结构的数据出现.目前关于分层数据的研究聚焦于模型的推广:从分层最小二乘回归模型到分层分位数回归模型、分层logistic回归模型.虽然,上述模型拓宽了数据的应用范围.但是仍存在一些问题如下:上述模型中的数据
学位
构建以国内大循环为主体,国内国际双循环相互促进的新发展格局,是中国基于国内经济形势和国际发展态势作出的重要科学判断和重大战略抉择。双循环新发展格局要求国内与国际各自形成一个小循环的同时,两者之间也必须形成一个大循环,小循环保障大循环的运行,大循环推动小循环的发展,两者共同构成双循环,促进经济增长。中国发展格局的确定是由国内经济条件和国际经济环境共同决定的,是中国寻求实现工业化过程中作出的战略选择。
学位
随着经济社会的快速发展,我国所面临的生态环境问题也日益严重。落实环境保护政策,注重发展绿色金融,合理运用金融、财政及税收政策等措施来有效应对环境问题,促进经济绿色发展是当前的迫切需要。因此,论文选取全国30个省、市、自治区的面板数据,对其绿色金融发展水平展开了测量和研究,进一步的对绿色金融改革创新试验区政策效应展开评估。首先,论文对国内外有关绿色金融、绿色金融政策效应的相关文献进行梳理,并将所涉及
学位
长江流域经济带在改革开放40多年间得到迅速发展,但是国际贸易形势压力等不稳定因素会对经济发展产生一定的干扰。城市经济韧性可以衡量一个城市对经济不稳定因素的抵御和抗干扰的能力。提升城市经济韧性,实现经济高水平发展是“十四五”时期的重要命题。制造业产业链的安全稳定是经济稳定发展的基础,其集聚效应带来的竞争优势对经济发展也有促进作用。因此,长江流域经济带产业集聚对城市经济韧性的影响关系值得研究探索。本文
学位
土地资源是一种有限资源,其特点之一是空间位置相对固定。随着我国经济建设的持续推进,人民生活的物质质量不断提升,由此产生的生态问题日益突出。由于工业化和城镇化的发展速度较快,我国城市建设用地规模不断扩大,道路硬化面积持续增加,农村生产用地和生态用地面积被动缩小,生产空间、生活空间和生态空间三者之间的矛盾愈演愈烈。为解决这一问题,必须加快转变生产方式,持续优化土地空间利用格局,以提高土地利用生态效率。
学位
实体经济是立国之本,也是我国实现经济高质量发展和构筑未来发展战略优势的重要支撑。当前,我国经济存在着资金流向虚拟经济的比例在不断提高,而流向实体经济的资金比例持续减少的问题,经济呈现出“脱实向虚”,实体经济企业面临严重的“融资难、融资贵”难题,同时我国着力于构建新发展格局与建设现代化经济体系,正处于转变经济发展方式和转换经济增长动力的关键时期,必须坚持推动实体经济发展,把发展经济的着力点放在实体经
学位