不完全数据图模型的结构学习

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:ldbeight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图模型被广泛用来表示和分析随机变量之间的因果关系以及条件独立性.图模型中主要包括有向无环图、无向图和链图.有向无环图(通常被称为贝叶斯网络)中的边都是有向边,并且不能构成有向环,用来描述随机变量的因果关系.无向图(通常被称为马尔可夫网络)中的边是无向边,一般用来描述随机变量的相关关系.链图是一类更加广泛的图模型,它不仅包括无向图,还包括有向无环图.在对图模型的大量研究中,结构学习引起了大量讨论.目前主要有两类结构学习的方法:一类是限制型学习方法,一类是基于得分的方法.大多数结构学习的方法仅仅处理含有完全观测数据的数据库.随着计算机的发展和普及,各种数据库已经被建立,不同数据库中的变量集不一定完全相同,可能有部分变量相同.例如,在药物研究中,一个研究者搜集了一些变量的数据库,另一个研究者搜集了另外一些变量的数据库,在他们搜集的数据库中可能有相同的变量,这就是所谓的多数据库.本文主要提出两个算法,一个是基于多重数据库构建链图的算法,另一个是因果强分割搜索算法.第一个算法是从多重数据库中进行链图的结构学习,我们首先从每个单独的数据库中学习它的局部结构;其次把这些局部结构组合在一起构建一个在所有变量上的全局结构;再次,删除假边,构建全局骨架;最后,确定边的方向,构建等价类.这个算法不需要条件独立性假设,而条件独立性在大多数理论中是一个基本的假设.第二个算法是利用可观测样本集进行强分割搜索.在因果强分割搜索算法中,每个变量被分配到集合A、B、C中,并且A⊥⊥B|C.为了使结果最优化,我们在搜索过程中注意两个问题,一是使C中的变量尽可能少,二是使A与B的变量个数相差较小.这个算法是一个更加有效率的算法:首先,删减C中的变量在算法的中间进行,这就避免了C所包含的变量过多,提高了假设检验的效率;其次,本算法输出的是因果强分割,因果强分割具有很多好的性质,如在因果强分割下,有向无环图具有估计可压缩性、条件独立可压缩性、模型可压缩性,这就降低了统计分析的复杂性,并且提高了分析的有效性;最后,本算法的假设检验都是在数量相对较少的变量集进行的,可以提高小样本下大规模稀疏网络构建的有效性.我们在忠实性假定下对两个算法的正确性进行讨论,并给出例子演示算法的运行过程.
其他文献
每年三四月份是心肌梗塞、脑血管病(脑血栓、脑缺血、脑溢血等脑中风)的发病高峰期之一。现在的天气虽说是越来越暖和,但是偶尔也会有忽冷忽热的感觉。寒冷使血液粘稠度增加,
1.血脂沉积是引起动脉硬化的罪魁祸首!脑中风、冠心病、高血压、糖尿病统称为心脑血管病,所谓的心脑血管病就是心脑系统的血管所发生的动脉粥样硬化性病变。在解剖学上,切开
泰国在世界大米市场上出口量的排位正面临着国内外因素引起的挑战:国内因素即稻米典押政策1,虽然该政策保护国内农民的收入,却导致泰国大米价格高于世界市场,成为出口的障碍,还有
  佳能(Canon)FP35mm单镜头反光照相机是日本佳能照相机公司1964年继FX型后推出的普及型机种。可拍24mm×36mm画幅36张。标准镜头为佳能50mmF1.8镜头(茶色膜),镜筒铝质合金
冠心病患者应参加适宜的运动锻炼,或做些轻微的体力劳动,也可干些家务活。这些轻体力活动是十分必要的,将有助于提高肌体的活动耐力,改善心功能和心肌对缺氧的耐受性。在进行
波音商用飞机公司( Boeing Commercial Airplanes)选择航美国际有限公司为其供应复杂铝合金铸件,波音公司将在英国谢菲尔德新的工厂加工这些铸件.去年波音宣布将在英国谢菲尔
【栏目要求】  1. 将学生习作根据中考分值给出成绩; 2. 在应该修改的地方划线并标注序号;  3. 根据所标序号进行修改并说明修改的理由; 4. 给学生习作点评;  5. 请点评名师提供简历一份,包括:学校、职务、 职称、荣誉、教研教学成果、照片一张。  投稿邮箱: zxsyy2007@163.com或whzxsyy@163.com  来稿请寄: 430079 华中师范大学外国语学院《中学生英
期刊
1.认证时间及地点  时间:2016年11月的第一个周末。  地点:视报名考生来源情况就近安排在中国铸造行业教育培训基地实施。
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
期刊