基于数据的学习:埃尔米特算法与法向量估计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:magy_java2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们主要研究学习理论中关于回归,流形学习和数据分析的一些算法。我们将详细地讨论这些算法的设计,并从逼近论的观点讨论其渐近性质。   论文的第一部分,在再生核Hilbert空间中最小二乘回归正则化算法的框架下,我们研究了基于梯度样本数据的学习问题。在表示定理的帮助下,算法的求解归结为求解一个线性方程组,系数矩阵中涉及核函数值的Gramian矩阵以及核函数偏导数值的Hessian矩阵。额外的关于梯度的样本值可以提高算法的学习性能。通过运用采样算子分析样本误差和Sobolev空间中的积分算子分析逼近误差,我们给出该算法的误差分析。   法向量估计是处理点云数据以及计算机图形学中曲面重构的重要研究课题。在论文的第二部分,我们考虑欧式空间中余维为1的子流形上的法向量估计问题。由于流形是未知的,我们要利用在流形上随机采样得到的样本点来估计法向量。我们提出了一种由核函数构造的学习算法,它实际上是无监督形式的梯度学习。算法的求解归结为求解一个线性代数的特征向量问题。在真实的法向量和采样分布满足一定的条件时,我们得到了关于该算法的误差估计。   在论文的最后一部分,我们主要讨论样本依赖假设空间中的正则化回归问题。对于给定的一组样本数据,样本依赖假设空间中的函数定义为由核函数和样本数据产生的一族基函数的线性组合,因此空间中的函数完全取决于其线性组合的系数。这种核函数构造的假设空间其依赖样本的特质给学习算法带来很大的灵活性和自适应性。在这种空间里讨论的正则化算法与传统的再生核Hilbert空间中的算法有本质的不同:我们所考虑的核函数不是对称的,从而不具有半正定性,正则化子作为作用在该空间中函数上的泛函,被取为其相应的组合系数的范数的次幂。这种不同增加了误差分析的困难。   具体来说,我们主要在本文中研究了两种情况:p= 1和p= 2。当 p= 1时,l1正则化子经常会使解向量具有稀疏性,从而极大提高算法运行的效率。   当p= 2时,相应的算法是线性的并且可以通过一个线性方程组来求解。这两种算法都已经被一些文献研究过。在本文中,我们利用关于l2经验覆盖数的中心极限定理得到了学习算法目前为止最好的收敛阶。因为我们的目的是给出一种容量相关的分析方法,对于在误差分析中出现的由非对称核函数构造的函数空间,我们给出了其中的单位闭球关于l2经验覆盖数的性质,这在我们的分析中起了十分关键的作用。
其他文献
土壤中水分的含量直接影响着农作物的生长,要准确预测水分所占的比例并进行适时的灌溉,需要我们充分地掌握其动态变化规律;但在实际中,土壤含水量变化受很多因素的影响,其变
对于一类带狄利克雷边界条件的半线性椭圆形方程,许多数学家进行过深入的研究。本文主要是更进一步的讨论一种特殊的带狄利克雷边界条件的半线性椭圆形方程的解及其性质。通过
Brill-Noether理论是研究代数曲线上的特殊除子或线性系的经典理论,Clifford定理是这个理论的第一步.本文的主要目的是想推广代数曲线上的Clifford定理到光滑代数曲面S上. 
变点问题自20世纪70年代一直是统计中的一个热门话题,它广泛应用于工业,经济,金融和地震预测等多个领域.一般认为,变点问题的研究始于Page于1954年在Biometrike上发表的一篇