【摘 要】
:
概率模型由于其灵活的表达形式成为当前广泛使用的密度估计和聚类工具之一。目前,随着因特网技术的快速发展,信息化数据呈现出爆炸式增长,如何将概率模型应用于大规模数据集
论文部分内容阅读
概率模型由于其灵活的表达形式成为当前广泛使用的密度估计和聚类工具之一。目前,随着因特网技术的快速发展,信息化数据呈现出爆炸式增长,如何将概率模型应用于大规模数据集上成为了急待解决的问题。针对这一现象,本文主要就如何解决大规模数据集上概率混合模型中的参数估计和模型需选择问题进行了深入探究。首先,本文介绍了当前概率模型的研究现状和意义,引出了概率模型的定义,对模型参数估计和模型选择的两种主要方法——确定性方法和非确定性方法进行了介绍,其中,确定性方法以EM算法为主,但是EM算法存在初始值敏感和不能自动确定混合分量数的问题。因此采用以贝叶斯方法为代表的非确定性方法。但是直接使用贝叶斯公式并不能求解,因此采用近似推理方法解决该问题。接下来,本文对逆狄利克雷混合模型进行建模,采用传统变分贝叶斯框架,通过不断最大化变分函数目标的下界来逼近真实的后验分布。在传统变分贝叶斯基础上,引入随机变分贝叶斯方法,解决传统变分贝叶斯方法效率低的问题。传统变分贝叶斯方法更新局部参数时需要估计所有数据点的局部变分参数。随机变分方法每次迭代更新局部参数先抽取部分样本计算局部变分参数,再根据局部变分参数求解中间全局变分参数,最后将中间变分参数和上一次的全局变分参数加权平均得到当前的全局变分参数。最后,将本文提出的随机变分方法和传统变分方法进行实验对比,设置合成数据集,对比两种算法的估计准确率,实验结果表明随机变分方法能够准确估计模型参数和混合系数,同时减少了计算量,大大提高了算法的运行效率。在公认的数据集Scene13和Caltech04上进行图像分类实验,在实际场景中验证了随机变分算法的准确性和高效性。
其他文献
随着人工智能和万物互联时代的到来,高精度的位置服务已经成为社会发展的必备需求,特别是当无人车、无人机等高科技产品出现在人类的社会生活中,瞬间受到了人们热烈的欢迎和
卢作孚是近代著名的爱国实业家,同时也是探索教育救国道路的践行者。这种身份上的双重性使得卢作孚在从事教育事业中不仅形成了十分独特的教育思想,而且较之一般教育家,他更
我国社会目前正处于产业结构转型升级的关键时期,产业结构转型升级最为关键的是培养高素质的创新型应用型人才,但目前我国新建本科院校在转型的过程中还存在着一些问题,如人
管道运输在国民经济和社会发展中发挥着重要作用。然而在管道长期服役的过程中,由于各种原因会发生不同程度的缺陷。较大的缺陷会使管道产生泄漏造成严重的后果。因此快速有效地检测出管道中的缺陷显得至关重要。超声导波检测技术跟传统的检测技术相比,单次检测距离远,检测时间短,检测效率高。采用超声导波检测技术具有较大的优势,越来越多的专家学者把超声导波检测技术用于进行管道检测的研究。超声导波检测管道系统中最重要的
孟加拉湾热带气旋是造成我国低纬高原地区强降雨的天气系统之一,在其主体环流尚未到登陆之前,就可以在低纬高原地区造成远距离降雨过程。本文采用NCEP再分析资料、ERA-Interim再分析资料、中国气象局台站降水资料、以及JTWC最佳路径资料,识别出1981—2012年间孟加拉湾热带气旋在我国低纬高原地区引起的远距离强降雨事件(predecessorrainevent,PRE)21例,PRE事件发生频
混沌键控技术是无线通信领域中快速发展的技术之一。混沌键控技术具备较强的抗干扰性和安全性,使其成为了研究热点。相关延迟移位键控(Correlation Delay Shift Keying,CDSK)
设备对设备(Device to Device,D2D)通信由于发送功率低,传输效率高而得到广泛应用。虽然5G技术发展迅速,但终端互联设备的增加,数据量的增长都使得智能终端的能耗增加。同时,
“物质的量”计算是高中化学计算中最基本的计算,也是最核心的计算。同时,“物质的量”是高一学生学习的第一个重点和难点,根据作者了解的情况学生对“物质的量”计算掌握较
随着计算机、数字图像处理、传感器等技术的迅速发展,基于计算机视觉的表面缺陷检测已成为机器视觉应用领域的研究热点之一。目前,相关研究大多都采用图像处理或者机器学习等
大气污染问题日益严峻且复杂多变。作为大气污染的主要构成部分,挥发性有机物(Volatile Organic Compounds)的有效降解处理引起了社会的广泛关注。甲胺是常见的一类含氮污染物,且对大气环境与人的身体健康均有重大影响。甲胺的光催化降解情况对其它的VOCs,尤其是有机胺的降解存在重大意义。而光催化技术是解决VOCs污染的一类经济环保的方法。在众多光催化剂中,TiO_2因其光催化性能优、