论文部分内容阅读
二十世纪七十年代,E.F.Codd提出了数据库的关系模型,开始了数据库关系方法和关系数据理论的研究,并逐渐应用到各个领域。这使得人们借助数据库对海量数据进行处理以及查询成为了可能。但是,在很多领域还有很多问题难以用现有的关系数据库技术来解决。比如,在现实世界中存在着许多不确定的概率性的数据,关系数据库虽然能够存储不确定性数据,但是随着传统的关系模型应用范围的扩大以及数据库自身的发展,这些早期的理论即经典关系数据库理论需要进一步推广与改革。当在关系数据库中加入了概率关系模型后,由于概率关系模型可以描述现实世界中的不确定信息,这样就使得关系数据库表达数据的能力得到了增强,同时使得查询结果能够更准确更合理地反映客观世界的本来面目。因此,对在概率关系模型下的不确定数据的处理方法进行研究具有很重要的意义。本文主要针对概率关系模型及其查询进行研究,本文所作的主要工作如下:首先,在前人研究的理论基础上对概率关系模型PRM(Probabilistic Relational Mode1)进行了总结,针对PRM模型存在的一些问题进行了改进,对于概率关系数据库中的元组进行了有效地划分,把它们分成不相容元组和相互独立元组。在此基础上,对它们进行了定义,从而解决了投影不合理的缺点。其次,本文介绍了概率查询及其算法,给出了最近邻查询的定义和基于R-树的深度优先(DF)算法,并在此算法基础上进行了一些改进。最后,以房屋中介管理系统为实例,介绍了概率关系模型及其查询在数据库中的应用。在系统中使用概率关系模型来建立数据库模型,选择关系型数据库管理系统SQL Server 2005为后台数据库,使用面向对象的开发工具Visual C# 2005进行系统程序设计。将概率关系引入房屋中介管理系统是对传统房屋中介公司服务方式的一个突破,使房屋中介公司能够更好地满足客户需求。