论文部分内容阅读
因果问题一直是人类所关心的问题,但直到20世纪才有了一个比较数学化的定义。如何从观测数据中识别出因果作用也是统计学领域的一个具有挑战性的问题。之所以称之为具有挑战性,不仅仅是因为观测数据不满足随机化的假定,更是因为其数据往往并不完整,存在缺失数据的现象。而缺失数据的问题也一直是统计学中的热点问题,虽然已经有了很多成熟的解决方法,但是在因果推断领域仍然没有一个理想的解决方法。 本文将要讨论的问题就是研究如何在原因与结果变量均存在非随机缺失的观测数据中识别其因果作用。为了识别其因果作用,本文将在虚拟事实的框架下,利用图模型的方法将非随机缺失机制的信息表示出来。首先,本文讨论无需处理前协变量辅助的情况,论证在非随机缺失机制下潜在结果变量的联合分布和因果作用的可识别性。但是,在很多情况下由于非随机缺失数据导致潜在结果变量的联合分布和因果作用不可识别。针对这种情况,本文引入了一个处理前协变量作为辅助,使得可以识别潜在结果变量的联合分布。进一步在有些非随机缺失机制下,即使引入协变量也不可识别潜在变量的联合分布,而只能识别平均因果作用。最后利用随机模拟评价在各种非随机缺失机制下因果作用和联合分布的可识别性。