【摘 要】
:
非负矩阵分解是在保持非负性约束下一种矩阵分解方法。由于在很多情况下非负性假设可以带来物理上的解释,因此非负矩阵分解被越来越多地应用到文本、图像处理等领域中。然而,非
论文部分内容阅读
非负矩阵分解是在保持非负性约束下一种矩阵分解方法。由于在很多情况下非负性假设可以带来物理上的解释,因此非负矩阵分解被越来越多地应用到文本、图像处理等领域中。然而,非负矩阵所分解得到的低秩矩阵的维数对于分解起着重要的作用,一般需要根据实际问题进行选取。由于这一维数反映了分解的规模或深度,因此,其选择问题也称为非负矩阵分解的模型选择问题。在实际中,我们仅仅知道所要分解的矩阵,其真实的分解维数是隐藏于这些数据中,并且也无法从分解式确定出分解维数。如果选取的维数比较小,其模型趋于简单,但分解的精度则会偏底。返过来,如选取的维数比较大,其分解的精度则提高,但模型趋于复杂。如何选取一个最优的分解维数或模型则是非负矩阵分解中一个关键问题。目前,人们还没有给出任何可行的非负矩阵分解的维数或模型选取准则。实际上,非负分解的不唯一性和参数的稀疏性使得模型选择更为复杂和困难。于是模型选择就成为非负矩阵分解中一个没有解决的重要问题。本文初步研究了非负矩阵分解模型中的模型选择问题。通过将非负矩阵分解模型转化为一个概率模型,使得最小描述长度准则可以应用到非负矩阵分解模型的模型选择问题中。另外,由于一般的非负矩阵分解模型选择比较困难,我们在分解时引入正交性约束来克服上述的困难。正交性约束使得我们可以准确地确定出模型的复杂度并并使得分解从理论上具有唯一性。我们从理论和实验中分析了能够正确进行模型选择的条件:数据中噪声的主成分要小于对其进行编码所需要的位数。另外通过模拟数据和文本数据上的实验,验证了最小描述长度准则对于有正交约束的非负矩阵分解的模型选择问题的有效性。
其他文献
多播是一种高效的通信方式。IP多播由于自身的各种原因而不能广泛部署。因此,一些学者提出了应用层多播,应用层多播将多播转发功能从路由器转移到端系统上,使得多播可能能够进行
本文对激光散斑无损检测系统中的条纹图像滤波算法、相位去包裹算法和缺陷识别算法进行了研究,并针对现有算法的不足之处作提出了一些改进算法。 对于滤波算法,本论文比较了
伴随着教改新理念和新技术的不断涌现,以翻转课堂和移动学习为代表的越来越多新型的教育教学理念和模式逐渐走进人们的视线.随着微信的普及和发展,微信公众号成为了信息受众
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
以矮牵牛(Petunia hybrida)花序cDNA为模板,利用EST数据库信息,克隆了一个MADS-box基因编码区序列,GenBank登录为PMADS20(GU129907)。进化树分析表明,PMADS20属StMADS11亚家
农村留守儿童是一个比较特别的群体,在生理以及心理发展方面,和普通家庭的孩子相比,他们还差好多.因此,对于他们的体育教育问题也就应该受到社会更多的关注.本文就对在核心素
随着计算机、网络和通信技术的飞速发展,为基于计算机和网络的文字、图形图像、音视频等数字文件的使用、传播提供了便利的途径,然而数字文件极易被复制和篡改的特性,使得数
在WPKI(Wireless Public Key Infrastructure,无线公共密钥基础设施)中,与无线终端通信的服务器(以下简称服务器)必须向无线终端提供证书以保证通信的安全,所以无线终端必须获得
中职生的英语学习基础普遍薄弱,对于英语的学习缺乏兴趣.在教学中,如何改进英语教学方法、提高学生学习兴趣是很值得我们英语教师研究和探讨的课题.笔者结合中职英语教学实际
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.