【摘 要】
:
随着信息技术的飞速发展,数据的规模和维度也在爆炸性增长。张量作为向量和矩阵的高阶推广,可以更直观地表示高维度数据的结构性,并保持原始数据的内在关系。基于低秩张量填
论文部分内容阅读
随着信息技术的飞速发展,数据的规模和维度也在爆炸性增长。张量作为向量和矩阵的高阶推广,可以更直观地表示高维度数据的结构性,并保持原始数据的内在关系。基于低秩张量填充的研究在很多领域受到了广泛的关注,如数据挖掘、数值分析、图像处理、信号处理、计算机视觉等。现有的张量填充方法多在低秩假设的前提下对单个张量进行的。当张量数据结构非常复杂或者缺失比例非常高时,单个张量填充的准确率会受到很大的影响。利用辅助信息联合分解来自多个数据源的数据可以提高缺失值填充的准确率。当多源张量间在某个模式上有耦合关系时,传统方法认为数据间在该模式上的因子矩阵完全共享,并基于共享因子矩阵进行建模。然而,现实中很多数据间可能具有更加复杂的共享关系,甚至它们之间没有模式耦合,但数据间具有极高的相关性。针对这些情况本文做了以下两点工作:其一,本文针对张量数据间在耦合模式上共享部分因子矩阵的情况,提出了部分共享的联合张量分解(CTF-PSF)的填充方法。该方法分别对数据共享部分和非共享部分进行独立优化。分别通过联合分解模型和独立分解模型对共享部分和非共享部分交替拟合。实验结果显示该方法可以实现提高张量填充的准确率,并以较低的参数空间获得较好的填充精度的目的。其二,本文针对多源张量数据间在耦合模式上存在的其他共享关系的情况,如近似共享,提出了通过软约束共享因子的多源张量填充算法(AMTC-SCSF)模型。该模型同样适用于多源张量数据间不存在模式耦合,但数据间具有极高相关性的情况。此外,相比传统模型,本文通过对目标函数加入误差权重解决了由于多源数据中可观测值不均衡而影响填充精度的问题,并通过约束传递的方式将软约束模型扩展为多个数据源与多个共享矩阵的情况。实验结果展现了该模型的准确性、可行性、有效性。
其他文献
近年来,淡水湖泊的富营养化问题日益突出,随着大量含氮、含磷物质的输入,水质不断发生恶化,原有的生态平衡被打破,严重损害了湖泊的生态功能,因此削减水中氮、磷含量对于控制湖泊富营养化至关重要。湖泊中发生的一系列物质循环过程有效地改变了氮、磷等物质的赋存状态及输出途径,在一定程度上缓解了湖泊的富营养化水平。而微生物作为物质循环过程中的主要参与者,不仅在水质评价中发挥了重要作用,同时在改善水质方面也做出了
黄瓜棒孢叶斑病是近年来在黑龙江省黄瓜种植区新流行的一种气传病害,在症状上易与黄瓜其他病害混淆,环境条件适宜时病菌潜伏期短、传播迅速,具有多次重复侵染,严重威胁着黄瓜生产。明确黄瓜棒孢叶斑病在黑龙江省的分布,并对病害进行快速、准确的鉴定及早期预测,对于病害的防治具有重要意义。本文对黑龙江省黄瓜棒孢叶斑病的发生情况调查,对疑似该病的致病菌进行形态学及分子生物学鉴定,建立并优化了黄瓜棒孢叶斑病菌的实时荧
随着新课改的逐步推进,小学数学教学理念和教学模式都在创新,小学生的学习兴趣培养、学习能力锻炼、学习思维养成,是当前小学数学教师的教学工作重中之重。教师要根据有效的
目的:探讨松果菊苷改善大鼠生精功能障碍的作用,为松果菊苷在促进生精功能方面的应用提供理论基础。方法:体内实验,60只Wistar雄成年性大鼠正常饲养5天后,称重后随机分成6组(每组10只:正常组、模型组、阳性对照组、松果菊苷25mg/kg剂量组(ECHL组)、松果菊苷50mg/kg剂量组(ECHM组)、松果菊苷100mg/kg剂量组(ECHH组)。除正常组外,其余各组大鼠腹腔注射醋酸铅连续7天,每
联烯作为一类特殊的合成中间体,在有机合成中扮演着重要的角色,其独特的结构和化学性能吸引着越来越多的化学家的广泛关注。联烯可以作为合成天然产物、药物以及各种材料分子
氨(NH_3)合成是所有生命和许多工业过程的基础,经典Haber-Bosch合成NH_3过程被称为20世纪最有影响力的发明之一,但是高昂的运行成本,复杂的反应条件,相对较低的反应产率,带来了大量的能源消耗。利用可持续能源-光能进行氮气(N_2)还原是现代氮化学领域研究面临的重要挑战。然而,传统的光催化材料大部分只能被紫外光激发且产生的光生载流子极易复合,极大的限制了其应用。此外,由于N_2分子中的
对于流体在非理想介质中的运动,人们通常用Navi-Stokes方程来讨论。Burgers方程是Navi-Stokes方程的典型形式,因此对于随机超声波方程的研究,我们着重讨论随机Burgers模型。
甲亚胺是常用的1,3-偶极子,与具有π系统的烯炔类化合物反应去构建含氮杂环。随着研究的发展,甲亚胺的环合反应更为环保,符合绿色化学的理念。但是甲亚胺的[3+2]环加成反应目
湖泊的分层与混合是热量、溶解氧或者营养盐输送、扩散的关键物理过程。湍流垂向扩散系数Kv描述水体的紊动程度,其是刻画热量、动量的交换、营养物质和气体的交换的主要物理
地理时空数据可视化是把视觉思维、模式辨识和计算机数据存储、处理能力相结合,将地理现象的空间分布、时空变化等利用图形的方式直观地表达出来。地理时空数据可视化是理解