基于信息论的贝叶斯网络结构学习算法研究

来源 :东华大学 | 被引量 : 7次 | 上传用户:chenjiechn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络模型是不确定性知识表示和建模领域中最经典、最有效的模型之一。贝叶斯网络自然地将概率论与图论相结合,既能反映出观测数据的内在规律,其图形化的表示方式又具有形象直观的特点,且与神经网络相比为白盒模型,具有良好的可理解性和逻辑性,因此在机器学习、人工智能、生物医疗、故障分析等方面得到了广泛的应用。本文首先对贝叶斯网络模型进行概述,介绍了贝叶斯网络的研究背景及意义、研究历史及现状以及贝叶斯网络的研究前沿。然后按照逻辑的递进顺序详细阐述了信息论的基本知识和贝叶斯网络模型的相关理论,对于贝叶斯网络的学习方法进行了详细介绍,包括两种经典的参数学习方法和两种经典的结构学习方法,并对与贝叶斯网络联系非常紧密的因果关系理论进行了简单介绍。针对连续型随机变量的贝叶斯网络结构学习问题,本文提出了基于条件熵和高斯过程网络的贝叶斯网络结构局部打分法CE-GP,将互信息最大化原则转化为条件熵最小化原则,使用条件熵和高斯过程网络在贝叶斯网络结构学习的过程中为每个节点确定双亲节点集合时进行打分。通过在模拟数据集和酿酒酵母基因数据集上的实验表明,CE-GP打分法能够避免将连续型变量离散化带来的信息丢失,计算简单,准确度高,与本文提出的一种基于阈值的改进K2启发式算法相结合,能够以较小代价获取拟合较优的局部贝叶斯网络结构。针对大规模数据集的贝叶斯网络结构学习问题,本文提出了基于信息论、禁忌搜索和赤池信息准则的贝叶斯网络结构学习算法ITA。首先使用基于信息论的贝叶斯网络降维算法对非目标变量进行筛选,获取与目标变量密切相关的因素,作为贝叶斯网络结构中的节点,然后使用以赤池信息准则作为评分函数,禁忌搜索作为启发式方法的学习算法建立贝叶斯网络模型,以获得全局最优解。通过在SPECT和SIDO数据集上的实验表明,ITA算法能够准确获取领域中的核心因果关系,得到简洁直观的贝叶斯网络,同时具有较低的时间复杂度,是生物医学领域进行大规模不确定性知识表达的一种有效解决方案。
其他文献
集团为了考核信息系统运维的水平,与一些先进的指标进行比较,使用一些指标的得分数据来对企业信息系统运维情况进行分析,从而在对比中看出本单位的不足,努力在管理上得到更进一步的改进,在指标上能够获得更高的水平。针对信息系统运维集团提出的指标管理体系,其内容包括系统运行水平、系统运行安全、调运体系建设、运行队伍建设、运行专项工作、事故与障碍等指标。本文就是基于指标体系中各单位运行评价与分析系统提出利用高维
异步无线传感网络中的全网广播是一项最基本的网络服务,主要应用于环境监测、软件更新等场景。无线传感网络中的传感节点大多数由电池提供能量,所以网络中的能量有限,而转发数据
近年来,随着信息化向人类社会各个层面的渗透和发展,在企业、科学、互联网等领域均产生并汇集了大量数据,大数据时代已然来临。目前,越来越多的应用领域涉及到大数据的存储和
随着计算机网络技术的发展,网络尤其是Internet给人们的生活和工作提供了极大便利,如电子商务、网上银行等已经十分普及。网络在改变人们的生活方式和提供企业生产效率的同时,也
随着科技的高速发展,以及无线传感器网络在众多领域的广泛应用,无线传感器网络逐渐成为研究热点。因为传感器节点能量受限,而MAC协议直接关乎节点的能量使用效率,所以研究如何在M
随着最近几年互联网和电子商务产业的兴起,海量的物流需求对物流企业提出了巨大的挑战,传统的物流企业仓库运作模式已经无法适应庞大的物流订单吞吐需求,为此美国电子商务公
反skyline查询常用在数据挖掘和决策支持系统中,用于数据的多准则优化。但目前有关反skyline查询的研究仅限于集中式数据,分布式数据上的反skyline查询尚未有文献涉及。在现实
伴随着信息化时代的来临,形状检索技术作为信息检索的重要组成部分,受到了越来越多的关注。曲率尺度空间(CSS)形状检索技术是根据尺度空间思想和理论发展出来的一门技术,自提出
图像中的文字信息对于我们的日常生活具有非常重要的价值,为我们或者计算机理解生活场景提供了重要的线索。在实际应用中有许多需要使用复杂场景图像中文字信息的场合,例如智
当今社会,网络视频会议以及高清视频点播等应用广泛流行,这就对视频编解码的编解码质量以及编解码速度提出了更高的要求。与此同时,视频分辨率急剧增加,从QCIF(176×144)到当今最