论文部分内容阅读
一直以来,因果关系都是人类认知世界的本质来源。但是对因果关系的探索往往非常艰难。真实的因果关系反映了事物之间的本质联系,往往隐藏在表面现象背后而无法直接观察到,所以从观测到的现象中发掘事物内在的因果联系是统计学中非常具有挑战性的课题。然而在许多应用科学领域,将表面的相关关系作为因果关系的例子比比皆是,因为错误的认识而造成的悲剧也不在少数。因此,因果推断,这一发掘事物因果关系的统计领域,就显得愈发重要起来。近些年来,随着许多优秀的学者对于因果关系的不断研究探索,因果推断领域在理论以及方法上都取得了长足的进步。本文在前人的基础上做了两方面的理论研究:一、在线性模型的框架下讨论了直接、间接作用的可识别性问题;二、讨论了贝叶斯网络分类器中存在的交互作用。 直接、间接作用的识别问题一直都是因果推断领域中一个非常具有挑战性的课题,在实际应用中也有着非常重要的意义:直接、间接作用的识别往往揭示了事物发展过程的内在机制,这是大多数科学研究特别是因果推断领域所特别感兴趣的。识别直接、间接作用从理论上有着本质的困难,目前现存的理论方法也大多需要一些很强的假定:如可忽略性假定(Ignorability Assumption)和排除限定假定(Exclusion Restriction)。但这些假定无法被实际观测数据所检验,在实际应用中往往无法取得很好的效果。本文在线性模型的框架下讨论直接、间接作用的识别问题,避免了无法检验的假设,提出了可被实际观测数据检验的识别条件。同时,文中所采用的方法具有较强的适用性,可推广到一般的广义线性模型。此外,本文中所有的模型都以半参数的形式给出,因而提供了一定程度上对于模型失拟的稳健型。在实际应用中,较传统的方法而言,具有一定程度的的优越性。 而贝叶斯网络分类器是近些年来机器学习领域一个非常热门的研究话题,其本身也在因果推断特别是因果网络学习领域有着很重要的应用。因此对于贝叶斯网络的内在结构及性质的探讨对因果推断领域的发展也十分有益。本文便集中地讨论贝叶斯网络分类器中对于交互作用的考虑。近些年来有不少国外学者致力于贝叶斯网络分类器的发展:如Naive Bayesian分类器,Augmented NaiveBayesian分类器,Tree-Augmented Naive Bayesian分类器等。这些分类器在实际的应用中往往可以取得很好的分类效果。但是,在这些研究中,人们往往过分专注于如何扩展贝叶斯网络分类器,将其结构一步步地变复杂以适应更一般的分类问题,却忽略了对贝叶斯网络作为分类器本身的研究。本文将针对二分类问题,在Log-Odds Ratio的度量下合理地给出交互作用的定义,深入地探讨了贝叶斯网络分类器中可能存在的属性变量之间的交互作用,并给出一种直接从图中判断交互作用的方法。